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主要研究方 向为： 时间序列分析和金融计 1 ：经济学 . 





近年来金融时间序列这个研究领域已经引起了人们广泛的关注，尤其是当2003 
年 Robert Engle 教授和 Clive Granger 教授获得诺贝尔经济学奖之后.与此同时. 
金融计量经济学领域也有了新的发展，尤其是在高频金融、随机波动率以及可用性 
软件方面.于是我们需要为高年级本科生.研究生、技术人员以及研究人员提供- 
套更为完善易懂的素材.在准备第2版时我们的主要_的是在新的发展和实证分 
析方面进行更新，并且扩大这本书的核心素材.将异方差和序列相关存在时的相合 
协方差估计、波动率建模的备选方法、金融因子模型、状态空间模型、卡尔曼滤波 
以及随机扩散模型的估计也包含了进来. 

因此木书扩展到了 12章.而且本书另一个重要的修改是包含了 S - Plu . s 命令和 
说明.木版同时更新了许多实证例子和练习，使其包含了最近的数据. 

新增的两章是第9章主成分分析及因子模型，与第 1] 章状态空间模型和卡尔 
曼滤波.本书所讨论的因子模型包含/宏观经济因子模型、基本面的因子模型和统 
计因子模艰.对于分析像组合收益这样的高维金融数据.这些模型是简单而有力的 
工具.为说明其应用，本 ID 给出了实证的例子.新增的状态空间模型和卡尔曼滤波 
是为了阐明其在金融中的应用以及容易计算的特点.笫12章中，在一般马尔科夫 
链蒙特卡罗 ( MCMC ) 框架下，状态空间模型和卡尔曼滤波可用来估 il 随机波动率 
模型.该佔计还用到了向前滤波和向后抽样的方法以增加计算效率. 

下面我们对第2版新增的内容给出一个简要概括. 

(1) 吏新/全书所用的 数据. 

(2) 给出了 S - Plus 命令和演示. 

(3) 第2章考虑了单位根检验以及存在异方差和序列相关时协方差矩阵的相 
合估计方法. 

(4) 第3章描述了波动率建模的备选方法，包括应用高频交易数据以及一项资 
产的日最高价和日最低价. 

(5) 第4章给出了非线性模型和方法的更多应用. 

(6) 第7章引入了更多风险值的概念和应用. 

(7) 第8章讨论了协整向量自回归模型. 

(8) 第10章涵盖了各种多元波动率模型. 

(9) 第12章中增加了有效的 MCMC 方法来估计随机波动率模型. 

本次修改主要得益于同事、朋友以及许多第〗版读者们富有建设性的意见.我 
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本书来源于自1999年以来我在芝加哥大学商学院所教的 MDA (工商管理硕 
L ) 金融时间序列分析课程.它也包含了过去几年我丌设的时间序列分析博士生课 
程的素材.这是一本引论性质的书，旨在对金融 il 量经济模型及其在金融时间序列 
数据的建模和预测中的应用进行综合与系统的阐述.本书的0的是使读者了解金 
融数据的基本特征、理解金融计量经济模型的应用并获得分析金融时间序列的经 
验. 

本朽可作为金融专业 MBA 学生的时间序列分析教材，也适用于商学、经济学、 
数学和统计学专业对金融计量经济学感兴趣的髙年级本科生和研究生.同时，它也 
可作为商业、金融、保险领域中要进行风险值 （ VaR , Value at Risk ) 计算、波动率 
( volatility ) 建模和对具有序列相关性的数据进行分析等工作的研究人员和业内人 
士的参考书. 

对计量经济学和统计学文献中的金融汁董方法的最新进展进行概述是本书的 
突出特点.这些进展包括当前的研究热点，如风险值、高频数据分析和马尔可夫链 
蒙特卡罗 ( MCMC ) 方法等.特别地，本书包含了一些在学术杂志上尚未发表的最 
新研究成果，可参阅第 fi 章中关于使用封闭形式的跳跃扩散方程来进行衍生产品 
的定价.第 7 章中基于非齐次一维泊松 (Poisson) 过程的极值理论计算风险值.以 
及第9章中带时变相关系数的多元波动率模型等.本书之所以介绍 MCMC 方法, 
是因为这类方法在金融计量经济肀中是强有力的工貝,并且对其有大量的应用. 

强调实例和数据分析是本书的另一个突出特点.全书采用实际金融数据来说 
明所讨论模型和方法的应用.我们的分析用到了多种计算机 软件： 线性时间序列 
的建模用 SCA(Scientific Computing Associates , 科学计算助乎)；估计波动率模型用 
KA ' lS(Kegression Analysis for Time Senes , 时闻 序列的回归分析)；实现神经网络和 
绘制 PS 格式的图形用 S - Plus . 运行这些软件包所需的一些命令将在相应各章后 
的附录中给出.特别地，用来估计多兀波动率模型的复杂的 RATS 程序在第9章的 
附朵 A 中给出.其中有些我和其他人编的 Fortran 程序可用来对简单的期权定价、 
估计极值模型、计算风险值和进行贝叶斯 ( Bayesian ) 分析.一些数据和程序可以在 
万维网上获得，网址为： http : //www.gsb.uchicago. edu/f ac/ruey .tsay/teaching 
/fts 

本书第 1 章描述了金融时间序列数据的一些基本特征.其他各章分为三个部 
分：第 一部分由第2章至第7章组成，讨论-维金融时间序列的分析及 应用； 第二 
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部分包括第8章和第9章.是关于多项资产收益率序列的；最后一部分是第⑴章 • 
介绍用 MCMC 方法进行金融中的贝叶斯推断. 

完全读惲本书需要具备基本统计学的概念和知识.在每章中，当一个必要的统 
计学概念第一次出现时，我都给出了 一个简短的回顾.即使如此.统计学或商业统 
计学的必备知识，包括概率分布、线性回归分析，还是竭力推 荐的. 金融知识对理 
解 书中所讨论的应用是很有帮 助的. 然而，对具有很好的计 M 经济学和统计学背景 
的读者来说，也会在本书中发现多方面有趣的主题和带挑战性的问题 

作为 MBA 的课程.第2章和第3章是核心内容，另外还可加入一些非线性方 
法的内容（如第4章的神经网络及第5〜7章和第10章中讨论的应用).对贝叶斯 
推断感兴趣的读者可以从笫10章的前 5 节幵始阅读 • 

金融时间序列分析的研究发展迅速.新成果不断出现.虽然我己经力图搜盖尽 
口 J 能广的内容，但仍有许多土题没有涉及或只是一带而过. 

我真诚地感谢我的老师和亲密的朋友 George C . Tiao , 是他在这些年中给了 
我指导和鼓励.让我有了对统计应用的坚定信念_感谢 Steve Quigley , Heather 
Haselkorn , Leslie Galeu , Danielle LaCourciere 和 Amy Hendrickson , 没舍他们的帮 
助这本书是不可能出版的.感谢 Richard Smith 送给我极值理论的估计 程序. 感谢 
Bonnie K . Ray 对本书的几个章节都给出了非常有益的 建议. 感谢 Steve Kou 送给 
我他的关于跳跃扩散模型论文的预印本.感谢 Robert E . McCulloch 许多年来在 
MCMC 方法上的合作.感谢选修我的金融时间序列分析课程的许多学生的反馈和 
投入.感谢 Jeffrey Russell 和 Michael Zhang 关于高频金融数据的深入讨论.同时， 
也感谢芝加哥大学商学院和美国国家科学基金的支持 • 最后，对我的妻子 Teresa 的 
一贯支持、鼓励和理解.对 Julie , Richani 和 Vicki 给我带来的快乐和灵感以及对 
我的父母亲给我的关爱.表示我最衷心的谢意 • 


蔡瑞胸 (Ruey S . Tsay ) 

芝加哥大学 




目 


录 


第1章金融吋间序列及其特征 . 1 

1.1 资产收益率 . 2 

1.2 收益率的分布性质 . 6 

1.2.1 统计分布及其矩的回顾…6 
1.2.2 收益率的分布 . 11 

1.2.3 多元收益丰 . 15 

1.2.4 收益率的似然函数 . 15 

1.2.5 收益率的经验性质 . 16 

\ H 其他过程 . 17 

练习题 . 20 

#考1 献 . 20 

第2章线性时间序列分析及其应用 •••• 21 

2.1 平稳性 . 21 

2.2 相关系数和自相关函数 . 22 

2.3 白噪声和线性时间序列 . 26 

2.4 简单的自回! H 模型 . 28 

2.4.1 AR 模型的性质 . 28 

2.4.2 实际中怎样识别 AR 

模型 . 35 

2.4.3 拟合优度 . 40 

2.4.4 预测 . 41 

2.5 简单滑动平均模型 . 43 

2.5.1 MA 模型的性质 . 45 

2.5.2 识别 MA 的阶 . 46 

2.5.3 估计 . 47 

2.5.4 用 MA 模型预测 . 47 

2.6 简单的 ARMA 模型 . 49 

2.6.1 ARMA (1,1) 模型的 

性质 . 49 

2.6.2 一般的 ARMA 模型 . 51 

2.6.3 识别 ARMA 模型 . 51 

2.6.4 用 ARMA 梭型进行 


预测 . 53 

2.0.5 ARMA 模型的三种 

表示 . 54 

2.7 单位根非平稳性 . 56 

2.7.1 随机游动 . 56 

2.7.2 带溧移的随机游动 . 57 

2.7.3 带趋势项的时间序列 . 59 

*2.7.4 一般的申位根 砟平稳 

模型 . 59 

2.7.5 单位根检验 . 60 

2.8 季节模型 . 63 

2.8.1 季节性差分化 . 64 

2.8.2 多重季节性模型 . 65 

2.9 带时间序列误差的回归模型 • •• • • 70 

2.10 协方差矩阵的相合估计 . 75 

2.11 长记忆模型 . 77 

附录一些 SCA 的命令 . 79 

练习题 . 81 

参考文献 . 83 

第3章条件异方差模型 . 85 

3.1 波动率的特征 . 86 

3.2 模型的结构 . 86 

3.3 建模 . 88 

3.4 ARCH 模型 . 90 

3.4.1 ARCH 模型的性质 . 91 

3.4.2 ARCII 模型的缺点 . 92 

3.4.3 ARCH 模型的建立 . 93 

3.4.4 —些例子 . 95 

3.5 GARCH 模型 . 99 

3.5.1 实例说明 . 102 

3.5.2 预测的评佔 . 106 

3.5.3 两步估计方法 . 106 






























































2 


0 


录 


3.6 求和 GARCH 模型 . 107 

3.7 GARCH-M 模型 . 108 

3.8 指数 GARCH 模型 . 109 

3.8.1 模型的另一种形式 . 110 

3.8.2 实例说明 . 110 

3.8.3 另一个例于 . 111 

3.8.4 用 EGAR.CH 楔型进行 

预测 . U 3 

3.9 门限 GARCI 1 模型 .1 H 

3.10 CHARMA 模型 . 115 

3.11 随机系数的自回归模型 . 117 

3.12 随机波动半模沏 . H 8 

3.13 长记忆随机波动車模型 . 118 

3.14 应用 . 119 

3.15 其他方法 . 123 

3.15.1 高频数据的应用 . 123 

3.15.2 日开盘价、最高价.最低 

价和收盘价的应用 ..•■125 

3.16 GARCH 模型的峰度 . 127 

附录波动率模型佔计中的一些 

RATS 程序 . 129 

练习题 . 130 

参考 X 献 . 132 

第4章非线性模型及其应用 . 135 

4.1 非线性模型 . 136 

4.1.1 双线性模型 . 137 

4.1.2 门限自回归模型 . 138 

4.1.3 平滑转移 AR ( STAR ) 

模型 . 142 

4.1.4 马尔可夫转换模型 . 144 

4.1.5 非参数方法 . 146 

4.1.6 函数系数 AR 模型 . 153 

4.1.7 非线性可加 All 模型…154 
4.1.8 非线性 状态空间模型 "" IS 4 

4.1.9 神经网络 . 154 

4.2 非线性检验 . 159 

4.2.1 非参数检验 . 160 

4.2.2 参数检验 . 162 


4.2.3 应用 . 166 

4.3 建模 . 167 

4.4 预测 . 167 

4.4.1 参数自助法 . 168 

4.4.2 预测的评估 . 168 

4.5 应用 . 170 

附录 A —些: X ：于非线性波动率模型 

的 RATS 程序 . 173 

附录 B 神经网络的 S - Plus 命令 •••174 

练刺 . 175 

参考文献 . 176 

第5章离频数据分析与市场微观 

结构 . 180 

5.1 非同步交易 . 180 

5.2 买卖报价差 . 184 

5.3 交易数据的经验特征 . 185 

5.4 价格变化模型 . 190 

5.4.1 顺序概率值模型 . 190 

5.4.2 分解模型 . 193 

5.5 持续期模型 . 197 

5.5.1 ACD 模型 . 199 

5.5.2 模拟 . 200 

5.5.3 估计 . 202 

5.6 非线性持续期模型 . 206 

5.7 价格变化和持续期的二元 

模型 . 207 

附录 A —些概率分布的回顾 . 211 

附录 B 危险率函数 . 214 

附录 C 对持续期模型的一些 RATS 

程序 . 215 

练糾题 . 216 

参考文献 . 218 

第6箪连续时间模型及其应用 . 219 

6.1 期权 .. 220 

6.2 一些连续时间的随机过程……220 

6.2.1 维纳过程 . 220 

6.2.2 广义维纳过程 . 222 

6.2.3 伊藤过程 . 223 





































































录 3 


63 伊藤引理 . 223 

« A 1 微分问顾 . 223 

6.3.2 随机微分 . 224 

6.3.3 —个应用 . 225 

6.3.4 u 和 (7 的估计 . 226 

6.4 股票价格与对数收益率的 

分布 . 227 

6.5 B~S 微分方程的推导 . 229 

6.6 B-S 定价公式 . 230 

6.6.1 风险中性世界 . 230 

6.6.2 公式 . 231 

6.6.3 欧式期权的下界 . 233 

6.6.4 i 寸论 . 234 

6.7 伊朦引理的扩展 . 237 

6.8 随机积分 . 238 

6.9 跳跃扩散模型 . 239 

6.10 连续时间模型的估 it . 245 

附求 A B-S 公式枳分 . 246 

附录 B 标准态概率的近似 . 247 

练习题 . 247 

参考文献 . 248 

第7章极值理论、分位数估计与 

风险值 . 250 

7.1 风险值 . 250 

7.2 风险度最制 . 252 

7.2.1 讨论 . 254 

7.2.2 多个头寸 . 255 

7.3 VaR 计算的计竜:经济方法 . 255 

7.4 分位数估计 . 260 

7.4.1 分位数与次序统计量… • 2(50 
7.4.2 分位数回归 . 261 

7.5 极值理论 . 262 

7.5.1 极值理论的冋顾 . 262 

7.5.2 经验估计 . 265 

7.5.3 对股票收益率的应用 ••••267 

7.6 VaR 的极值方法 . 271 

7.6.1 讨论 .. 273 

7.6.2 多期 VaR . 275 


7.fi.3 空头头寸的 VaR. 275 

7.6.4 收益率水平 . 275 

7.7 基于极值理论的一个新方法 • • • • 276 

7.7.1 统计理论 . 277 

7.7.2 超额均值函数 . 279 

7.7.3 极值建模的一个新 

方法 . 280 

7.7.4 基于新方法的 VaR 

it 算 . 282 

7.7.5 参数化的其他方法 . 283 

7.7.6 解释变量的使用 . 286 

7.7.7 模型检验 . 287 

7.7.8 说明 . 288 

练习题 . 291 

参考文献 . 293 

第 8 韋多元时间序列分析及其应用 ••••294 

8.1 弱平稳与夂叉相关矩阵 . 294 

8.1.1 交叉相关矩阵 . 295 

8.1.2 线性相依性 . 296 

8.1.3 样本交叉-相关矩阵 . 297 

8.1.4 多元混成检验 . 301 

8.2 向 量自回 归模型 . 302 

8.2.1 简化形式和结构形式 ••••303 

8.2.2 VAR ( l ) 梭型的平稳性 

条4牛和矩 . 305 

8.2.3 向鼠 AR(p) 模型 . 306 

8.2.4 建、 V —个 VAR(p) 

模 M . 308 

8.2.5 脉冲响应函数 . 314 

8.3 向最滑动平均模型 . 317 

8.4 向量 ARMA 模型 . 322 

8.5 单位根非平稳性与协整 . 327 

8.6 协整 VAR 模型 . 330 

8.6.1 确定性函数的具体化… *332 

8.6.2 最大似然估计 . 333 

8.6.3 协整检验 . 334 

8.6.4 协整 VAR 模型的 

预_ . 335 



































































K . fi.S 例子 .335 

8.7 门限阱整与交利 . 340 

8.7.1 多元门限樽_ . 341 

8.7.2 数据 . 341 

8.7.3 估计 . 342 

附录 A 向鼠与矩阵的回顾 . 344 

附录 B 多元正态分布 . 348 

附录 C —些 SCA 命令 . 349 

练习题 . 350 

参考文献 . 351 

第9章主成分分析和因子模型 . 353 

9.1 因子模型 . 353 

9.2 宏观经济因子模型 . 355 

9.2.1 单因 f 模型 . 355 

9.2.2 多因子模型 . 359 

9.3 基本曲因予模型 . 361 

9.3.1 BARRA 因于模型 . 361 

U .3.2 Kanm - l^ench 方法 . 366 

9.4 主成分分析 . 366 

9.4.1 PCA 理论 . 366 

9.4.2 经验的 PCA . 368 

9.5 统计因了分析 . 371 

9.5.1 估计 . 372 

9.5.2 因子旋转 373 

9.5.3 应用 . 374 

9.6 渐近主成分分析 . 379 

9.6.1 因子个数的选择 . 370 

9.6.2 例子 . 380 

练习题 . 382 

参考文献 . 383 

第10童多元波动率樺型及其应用 

10.1 指数加权估计 . 

10.2 多元 GARCH 模型 . 388 

10.2.1 对角 VEC 模型 . 389 

10.2.2 BEKK 模型 . 391 

10.3 重新参数化 . 393 

10.3.1 相关系数的应用 . 393 

10.3.2 Cliolesky 分解 . 395 


1 CU 二元收益半的 GARCH 

模租 . 398 

10.4.1 常相关模咿 . :扣8 

10.4.2 时变相关模型 . 402 

10.4.3 M 沂的一些发展 . 406 

10.5 更髙维的波动率模型 . 407 

10.6 因子波动率模型 . 412 

10.7 应用 . 414 

10.8 多元 t 分布 . 416 

附录对估计的一些注释 . 417 

练习题 . 422 

参考文献 .4.22 

第11章状态空间模型和卡尔曼 

滤波 . 424 

11.1 局部趋势模型 . 424 

11.1.1 统计推断 . 427 

11.1.2 卡尔曼滤波 . 428 

11.1.3 预测误差的性质 . 430 

11.1.4 状态平滑 . 431 

11.1.5 缺失值 . 435 

11.1.6 初始化效应 . 435 

11.1.7 估计 . 436 

11.1.8 所用的 S-Plus 

命令 . 437 

11.2 线性状态空间模型 . 440 

11.3 模型转换 . 441 

11-3.1 带时变系数的 

CAPM . 442 

11.3.2 ARMA 模型 . 444 

11.3.3 线性回归模型 .-150 

11.3.4 带 ARMA 误差的线性 

冋旳模型 . 451 

11.3.5 纯量不可观测项 

模型 . 452 

11.4 卡尔曼滤波和平滑 . 454 

11.4.1 卡尔曼滤波 . 454 

11.4.2 状态估计误差和预测 

误差 . 456 







































































11.4.3 状态平滑 . 457 

11.4.4 扰动平滑 . 459 

11.5 缺失值 . 461 

11.6 预测 . 462 

11.7 应用 . 463 

练习题 . 469 

参考文献 . 470 

第12章马尔可夫链蒙特卡罗方法及其 

应用 . 472 

12.1 马尔可夫链模拟 . 472 

12.2 Gibbs 抽样 . 473 

12.3 贝叶斯推断 . 475 

12.3.1 后验分布 . 475 

12.3.2 共轭先验分布 . 476 

12.4 其他算法 . 479 

12.4.1 Metropolis 算法 . 479 

1 2.4.2 Metropolis-Hasting 

算法 . 480 


12.4.3 格 T Gibbs 抽样 . 480 

12.5 带时间序列误差的线怍回归 ■••481 
I 2 .fi 缺失值和异常值 . 485 

12.6.1 缺失倌 . 485 

I 2. H .2 异常值的识别 . 487 

12.7 随机波动率模型 . 491 

12.7.1 —元模助的估计 . 492 

12 7.2 多元随机波动卓 

模型 . 496 

12.8 估计随机波动率模型的新 

方法 . 502 

12.9 马尔可夫转换模型 . 510 

12.10 预测 . 516 

12.11 其他应用 . 518 

练习题 . 518 

参考文献 . 518 

m ^\ . 521 


































第 1 章金融时间序列及其特征 

金融时间序列分析考虑的是资产价值随时间演变的理论与实践.它是一个带有 
高度经验性的学科，但也像其他科学领域一样，理论是形成分析推断的基础.然而， 
金融时间序列分析有一个区别于其他时间序列分析的土要 特点： 金融理论及其经 
验的时间序列都包含不确定因素.例如，资产波动率有各种不同的定义，对一个股 
票收益率序列，波动率是不能直接观察到的.正因为带有不确定性，统计的理论和 
方法在金融时间序列分析中起重要作用. 

本书的目的是提供一些金融則间序列的知识，介绍一些对分忻金融时间序列有 
用的统计工具，从而使读者获得各种经济计量力法在金融中应用的经验.第1章 
引入资产收益率的基本概念，井简要介绍本书所讨论的一些过程.第2章回顾了 
一些线性时间序列分析中的基本概念，如平稳性、自相关函数，引入了一些简单的 
线性模型来处理序列的序列相关性，并讨论了带时间序列误差、季节性、单位根非 
平稳性和长记忆过程的回归模型.当存在条件异方差性和序列相关时，该章给出 
了协方差阵相合估计的方法.第3章着重讨论了条件异方差性（资产收益率的条 
件方差）的建模，讨论了新近发展起来的用来描述资产收益率的波动率随时间演变 
的各种经济计 fi 模型.该章还讨论了波动率建模的其他方法，包括使用高频交易数 
据和一项资产的日最高价格和日最低价格进行建模.第4章讨论了金融时间序列 
中的非线性性，引入了能区别非线性序列与线性序列的检验统计量，并讨论了几个 
非线性模型.该章还介绍了非参数估计方法和神经网络，并且展示了非线忡模型在 
金融中的各种应用.第5章考虎的是高频金融数据的分析及其在市场微观结构中 
的应用，阐明了不同步（或不同时）的交易和买卖价格间的跳跃可能带来股票收益 
的序列相关性.该章还研究了不同交易之间持续时间的动态规律和一些分析交易 
数据的计量经济模型.第6章引入了连续时间扩散模型和伊滕 ( Ito ) 引理，导出了 
Black - Scholes 期权定价公式，并应用一个简单的跳跃扩散模型来刻画期权市场常见 
的一些特征.第7章讨论了极值理论、厚尾分布及其在金融风险管理中的应用.该 
章还特别讨论了 U 算金融头寸风险值 ( VaR ) 的各种方法.笫8章着重讨论多元时 
间序列分析和简单的多元模型，重点在于分析时间序列之间的交叉延迟关系.该章 
还介绍了协整、一些协整检验以及门限协整.并用协整的概念来研究金融市场屮的 
套利机会.第9章讨论了简化多元时间序列动态结构的力法和降低维数的方法，并 
介绍和演示了 3种因于模型来分析多个资产的收益率.第10章介绍/多兀波动率 
模型，其中包括带时变相关系数的模型.同时还讨论 f 怎样对一个条件协方差阵进 
行重新参数化，使之满足正定性的限制，并降低波动率建模的复杂性.第11章介绍 
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了状态空间模型和卡尔#滤波，还讨论了状态空间模型和本书中所讨论的其他计 M 
经济模型之间的关系该章还给出了在金融方面应用的几个例子.最后，第12章介 
绍了统计文献中一些新近发展起来的马尔可夫链蒙特卡罗方法，并把这些方法应用 
于各种金融研究的问题，如随机波动率模型和马尔可夫转换模型的估计. 

本书着重强调应用和实证分析.每章都有实际例子，很多时候经济计量模型的 
发展是由金融时间序列的实证特征来推动的.必要时，本15还提供/用束分析数据 
的计算机程序和命令.在某些案例中.程序已在附录中给山.书中各章的练习题也 
要用到很多实际数据. 


1.1 资产收益率 


多数金融研究针对的是资产收益率而不是资产价格. Campbell, Lo 和 Ma^Kin- 
lay (1997) 给出了使用收益率的两个主要 理由： 第一，对普通的投资者来说，资产收 
益率完全体现了该资产的投资机会，且与其投资规模 无关； 第二，收益率序列比价 
格序列更容易处理.因为前者有更好的统计性质.然而.资产收益率有多种定义. 

设巧是资 产在/ 时刻的价格.下面给出全书中要用到的一些收益率的定义.暂 
时假定资产不支付分红. 

羊期简单收益率 

若从第《 - 1天到第 f 天（一个周期）持有某种资产，则简单毛收益率为 

1 + 柘=^-或 P t = P t _ i ( l 4-«,). (1.1) 

^-1 


对应的单期简单净收益率或称简单收益率为 




Pt - Pt-x 


( 1 . 2 ) 


为 


多期简单收益率 

若从第 t - k 天到第天这 A 个周期内持有某种资产，则期简单毛收益率 


"t-k ns-i n-2 ' 

=(1 + /if) (l -h Rt-i) • • - (1 + Rt-k+l) 
k-1 

=IX (1 + Rt-j). 
j=o 


这样 . I 期简单毛收益率就是其所包含的这个单期简单毛收益率的乘积,称为复 
合收益率 . Av 期简单净收益率是私 [ fc 】 =(巧 Pt - k ) / Pt - k - 
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在实际中.确切的时间区间对讨论和比较收益率是非常重要的(例如是月收益 
率还是年收益率).若时间区间没有给出.那么就隐含地假定时间区间为1年.如果 
持有资产的期限为 A •年，则（平均的）年化收益率定义为 


年化的 {^[ fcj }= fj C 1 + ^- i ) 一 1 • 

i=o • 

这是由它所包含的这 & 个单期简单毛收益率的几何平均得到的,可以用下式计算： 

「19 

年化的 {/it [ A :]} = exp - ki (1 + Rt - j ) 

其中 cxp ( r ) 表示指数函数. h ^ r ) 是正数 a ; 的自然对数.因为计算算术甲均值比计 
算几何 T 均值容易.并且单期收益率般很小，我们可以用一阶泰勒 ( Taylor ) 展开 
来近似年度化的收益率，得到 

1 Aj— 1 

年化的{历 R t - j . (1.3) 

k j=0 

然而，在有些应用中. （1.3) 式近似的精度可能不够. 

连续复合 

在引进连续复合收益率之前，我们讨论一下复合的效果.假定银行存款的年利 
率为10%,最初存款为1 美元. 如果该银行每年支付一次利息，那么1年之后存款 
的净值变为1美元 x ( l +(). l ) = l.l 美元.如果该银行半年付息一次， G 个月的利 
息率是10%/2 = 5%,第1年之后净值是1美元 x (1 + 0.1/2) 2 = 1.102 5美元.一般 
地，如果银行1年付息 m 次，那么每次支付的利息率为 10%/ m , 1年后存款的净值 
变成1 x ( l +0.1/ m) m 美元•表 1-1 给出了年利率为10%时一些常用的时间间隔 
下存款〗美元的结果 


表 1-1 复合效果的演示（期限为1年，年利率为10%) 


型 

支付次数 

毎期的利率 

净 值 


1 

0.1 

s 1.1 oo oo 

轉 

2 

0.06 

S1.102 50 

:乎皮 

4 

0.025 

S1.1U：! 81 

n 

12 

0.008 3 

81.104 71 

堝 

52 

0 J /52 

S1.105 06 

天 

365 

0.1/365 

S1.105 16 

连续地 

oo 


S1.105 17 
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特别地，净值趋于 1.1052 美元 》 exp (0.1) 美元，这个信就是连续复合的结果.于是, 
我们可以清楚地看到复合的效果. 

—般地，连续复合的资产净值 .4 为 

A = Cexp(r x n) , (1.4) 

其中 r 是年利率， C 是初始资本， n 是年数①.由 （1.4) 式，我们有 

C = A exp (― r x n) , (1.5) 

称作 n 年后价值为 Z 的资产的现值.这里我们假定连续复合的年利率为 r . 

连续复合收益率 

资产的简单毛收益率的自然对数称为连续复合收益率或对数收益率 ( lo S - le tum ) 

P 

r t = In (1 + /?i) = In — =p t -^p, (1.6) 

其中仍 = hiP,. 与简单净收益率凡相比，连续复合收益率 TV 有一些优点.首先， 
对多期收益率，我们有 

rt [A;] = In (1 + [A:]) = In [(1 + (1 + • • • (1 -)- 

= ln(l + /2t) + ln(l + /?f_i) + ... + ln(l + jt+i) 

= i't + ^t~i + ... + 十 i. 

这样. 迕续复合多期收益率就是它所包含的连续复合笮期收益率之和.其次，对数 
收益率具有更容易处理的统计性质. 

资产组合收益率 

若一个资产组合由/ V 个资产组成，则该资产组合的简单净收益率是它所包含 
的各个资产的简单净收益率的加权平均.其中每个资产所占的权重是该资产的价值 
占资产组合总价值的百分比.设 p 是一个资产组合，它在资产 i 上的权重为叫，那 

么 P 在/时刻的简申收益率= f ： u h R u , 其中氏 ，是资产 i 的简单收益率 • 
然而，资产组合的连续复合收没有上述方便的性质.如果简筚收益率 
的绝对值都很小，则我们有 r p ， t « f w irit . 其中~是该组合在 f . 时刻的连续复合 
收益率.这种近似经常被用来研究 1 i 1 产组合的收益率. 

分红支付 

如果一个资产周期性地支付分红，我们必须修改资产收益牟的定义.设 A 是 
一个资产在第 f - 1天和第/大之 N 的分红，是该资产在第/个周期末的价格. 


①可为小数. 译者注 
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这样，分红并没有包含在 行中. 因此， f 时刻简单净收益率和连续复合收益率分别 
变为 ^ 

Rt= Ut - 1 - r t =\n(P t + D t )-\n 

超额收益率 

一个资产在《时刻的超额收益率是该资产的收益率与某个参考资产的收益率 
之差.这个参考资产通常是无风险的，如美国短期国债的收益率.简单超额收益率 
和对数超额收益率分别定义为 

Zt = Rt — 只 ot ， = ~ fot , (1-7) 

其中 Km 和 rw 分别是该参考资产的简单收益率和对数收益率.在金融文献中，超 
额收益率被认为是某个套利投资组合的盈利.在这个投资组合中，对某资产持多头 
头寸而对参考资产持空头头寸，且初始投资净值为 0. 

注释：头金融头寸意味着持有某资产.空头头寸则指卖出不属于自己的资 
产.这须通过从已购买该资产的投资者那里借入资产来完成.在之后的某天.卖空 
者有义务买进和借入完全相同數量的股份偿还给借出者.因为偿还时要求的是相 
等教量股份，而不是相等數量的美元，卖空者会由于该资产价格的下跌而获利.如 
果在空头持续期间该资产有现金分红，则支付给做空买卖的买者.卖空者也必须从 
自己的资源里配备相应的现金分红来补偿借出者.换句话说，卖空者有义务支出所 
借资产的现金分红给借出者. 门 

关系小结 

简荦收益牟吊与连续复合收益率的关系是 

n = lu (1 -f Rt ) , Rt = e r * — 1. 

如果收益率拓与 r * t 是百分比，则 

r t = 1001 n (1 + 盖)， R t = 100( e r " 100 - 1). 

收益率的时间累加使得 

\ + Rt [A：] = (1 + Rt) (1 4 - Rt-i) • • • (1 4- /?<• fcii), 
rt . [^] _ 十 r>_i H - 1- r t _ fc +.i. 

如果连续复合年利率为 r ， 则资产的现值与资产的未来价值之间的关系为 

A — C . exp (r x n) , C . = A pxp (—r x rj). 

例 1.1 若某项资产的月对数收益率为4.46%,则相应的月简单收益率为 10 ()[cxp 
(4.4( i / lU ( J )- l ]=4.5 b %. 同样,若某项资产在一个季度内的月对数收益举分别为 4.4 G %. 
-7.34%, 10.77%,则该资产的季度对数收益率为 (4.46-7.： M +10.77)%=7.89%. 
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1.2 收益率的分布性质 

要研究资产收 益率. 最好从它们的分布性质开始.目的是要理解不同资产、不 
同时间收益率的表现. 考虑 n 个资产，持有这 iv 个资产 r 个时间周期，如/ ：= 
I , -- , T . 对每个资产/，表示它在/时刻的对数收益率.所要研究的对数收益率 
为 { r ,«; t = 1, • • • , A r ; ^ = 1, •• • , T }. 也可以考虑简单收益率 { Rit \ i = 1. • • • , N\t = 
1, ••- , T } 和对数超额收益率 { = , N : t = I ,--- , T }. 

1.2.1 统计分布及其矩的回顾 

我们简要地回顾一下统计分布的一些基本性质和随机变量的矩.设 R A 表示 
k - 维欧几里德空间 ，： r e 表示： r 是中的点，考虚两个随机向量 X = 

( Xj ,-.. 和 Y = (4… y Y q )'. 令 e 4 ，y eB ) 表示 X 在子空间 Ac 
中且 y 在子空间 s C 中的概率.本书的大部分场合，都假定这两个随机向量 

是连续的. 

联合分布 
函数 


Fx.y (x. y,G) = P(X ^..x.Y x P R^, y G 

是参数为 0 的 X 与 y 的联合分布，其中不等号“是分量对分量的运算 . X 和 
Y 的规律由 F x , y (x,y:G) 刻画.如果和 K 的联合概率密度函数 f x . v [x ， y'0 、 
存在，则 

ry 

F'x.Y {^ y O) = /r, w (w,z ： 0) dzdw. 

J—oo J — oo 

这时， x 和 y 是连续型随机向量. 

边际分布 
X 的边际分布是 


Fx (*; 0) = Fx,y (JC ， oo, …， oo: 0) . 

这样， X 的边际分布可通过对 Y 求积分得到.同理， K 的边际分布也可类似得到. 
如果〖• = 1， A ： 是一个一元随机变量.其分布函数为 

F x ( x ) = P(X ^ x ;0), 

称之为久的累积分布函数 (Cumulative Distribution Function , CDF ). —个随机变 
量的 CDF 是非降的 | 即对 on < * r 2 有 F x ( xi ) < F x ( x 2 )], 且有 F x (- oo ) = 0, 
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F,v ( oc ) = 1. 对给定的概率 7 ;,使 p < F.y (心）成立的最小实数化称为随机变量 X 
的 P 分位点，更具体地， 

x v - inf { a * |p < F.v ( x ) }. 

本书中我们用 CDF 来计算检验统计量的 /; 值. 


条件分布 


给定 V < 1/的条件下 A ： 的条件分布为 

r ，- m P(X^x,Y^y;0) 

(X：0) = P[Y~4y,0) 

若所对应的概率密度函数存 在， 则给定 Y = y 的条件下， X 的条件密度为 

fx,y[X,y ： 0) 


/*lw (工; 沒） = 

其中边际密度函数 f u ( y ;0 ) 由下式得到 


Jv ( y ; 0 ) 


fu iy ^) 


fx,y ( a ：, y ; 0) dx . 


rll (1.8) 式知.联合分布、边际分布和条件分布之间的关系为 


( 1 . 8 ) 


/j：,y (*• y\ = fx\y 0) x fy (y- - 


(1.9) 


上述等式关系在时间序列分析中经常用到（如在进行最人似然估计时).最后, 
X 与 K 是相互独立的随机向量当且仅当 ( a :: 0) = / s ( a ;: 0)，这时 2/:«)= 
fx{x\0) f y (y ： 0). 

随机变量的矩 

一个连续型随机变量 X 的/阶矩定义为 

m\ = E (X L ) = x l f (x) dx, 

J—OO 

其中 “E” 表示期望 (expectation), /⑻是 X 的概率密度函数.一阶矩称为久的 
均值 ( mean ) 或期望.它度量的是分布的中心位置，记为 X 的/阶中心矩定义为 

7 叫 =£|( 义 — /i*/ = (x - fix) 1 f {x)dx. 

L J—oo 

假定上式中积分存在.二阶中心矩可度量 X 取值的变化程度,称为 X 的方差 ( varia ¬ 
nce ), 记为方差的正平方根&称为 X 的标准差.一个正态分布由它的前两阶 
矩决定.对其他分布，可能要了解其更高阶矩. 
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三阶中心矩度量 X 关于其均值的对称性，而四阶中心矩度量 X 的尾部.在统 
计学中，标准化的三阶矩叫偏度 ( skewness ). 标准化的四阶矩叫峰度 ( kimosis ), 它们 
分别用来描述随机变量的对称程度和尾部厚度.具体地.久的偏度和峰度分别定义 

为 _ _ 

[ < 

量 K ( j *) — 3叫做超额峰度 (excess kurtosia ), 因为正态分布的峰度 K (. r ) = 3.这 
样，一个正态随机变量的超额峰度为 0. 若一个分布有正的超额峰度.则称此分布 
具有厚尾性，厚尾的含义是指该分布在其支撐 ( support ) 的尾部有比正态分布更多 
的“质量”.在实际中，这就意味着来自于这样一个分布的随机样本会有更多的极端 
值，故称这样的分布为尖峰的 （ lcptokurtic ). 另一方面，一个具有负的超额峰度的分 
布是 轻尾的 （例如，有限区问上的均匀分布)，这样的分布称为低峰的. 

在应用中.我们可以用相应的样本偏度和样本峰度来估 u 偏度和峰度.设 
…，： r r } 是 X 的 r 个观察值.样本均值为 


T 



Ax = 于 

(1.10) 

样本方差为 

•p 



= T _ t XI (^t Ax), 

(1.11) 

样本偏度为 

T 



外)= (r — A*) ， 

(1.12) 

样本峰度为 




k( ^ x)= ( T - l ) ai ^ {Xt ~ l，x) - 

t*— 1 

(M3) 


在正态分布的假定下， S (: r ) 和 A ’ Or )- 3均渐近地服从均值为零、而方差分别为 G/r 
和 24/ T 的正态分布[参见 Sncdecor 和 Cochran (1980)，第78页】.我们可以用这幽渐 
近性质来检验资产收益率是否具有正态性.给定一个资产收益率序列 , r r K 
要柃验其偏度，即要考虑零假设: . S ’( r ) = 0对备杼假设: S ( r ) / 0.由 (1.12) 
式所定义的样本偏度的比统计量为 

t - S{r) 

s/W 

决策规则 如下： 在显著性水平 a 下，若|<| > Z t 、 n ' 则拒绝零假设，其中 Z a/2 是标 
准正态分布的100(«/2)上分位点.另外一个方法是计算检验统计量 < 的 P 值，当 
且仅当 p 值小于《时拒绝队. 


S ( j ;) = E 


(A - 
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类似地，我们可以用假设检验: K ( r ) - 3 = (.) 与: f <{ r ) — 3/0, 来检验 
收益率序列的超额峰度.检验统计量为 

▲ J<(r)-3 

~ s/WT 1 

并且该统计量渐近标准正态分布.决策规则为当且仅当检验统计量的 p 值小于显 
著性水平 a 时拒绝叫. Jarque 和 Bera (1987) 结合了这两个先验检验,并利用了下 
述统计量 

… 5 2 (r) , (K(r) - 3) 2 
' ~G/T ~~ 24/T ~~’ 

其中.该统计量的渐近分布是自由度为2的 x 2 分布.如果 JB 统计量的 p 值小于 
显著性水平则拒绝正态性的 //( j 假设. 

例 1.2 考虑表 1-2 中所用的 IBM 股票的日简单收益率.作为描述性统计量的一 
部分，收益率的样本偏度和峰度可以用各种统计软件包很容易地得到.我们给出了 
实例中用到的 SCA 和 S-P us 命令.其中 ‘ d - ibmvwewsp 6203. txt ， 是数据文件名.需 
要注意的是，在 SCA 中峰度指的是超额峰度_输出结果中超额峰度很高.表明 IRM 
股票的 R 简单收益率具有厚尾性为/检验收益率分布的对称性.我们用检验统计 

0 ： 077 5 = 

— 0.024 • ， 

该检验统计量的 P 值大约为0.001，表明在5%的显著性水平下， IBM 股票的日简单 
收益率显著地右偏. 


表1_2 几种股指和股栗日或月简单收益率和对数收益率的描述性统计量" 


an 券 

起始 u 期 

样本慑 

均值 

标准斧 

偏度 

超额峰度 

最小值 

城大值 




□ 简畝收益車 （％) 




SP 

62/7/3 

10446 

0.033 

0.945 

-0.95 

25.76 

-20.47 

9.10 

VW 

62/7/3 

10446 

0.045 

0.794 

-0.76 

18.32 

一 17.14 

8.66 

RW 

62/7/3 

1IM46 

0.085 

0.726 

-0.89 

13.42 

一 10.39 

6.95 

IBM 

62/7/3 

1044b 

0.052 


-0.U8 

1U.21 

-22.96 

13.16 

Intel 

72/12/15 

7828 

0.131 

2.998 

-0.16 

5.85 

29.57 

26.38 

3M 

62/7/3 

10446 

0.054 

1.465 

-0.28 

12.87 

-25.98 

11.54 

Microsoft 

86/3/14 

4493 

0.157 

2.505 

-0.25 

8.75 

一 30.12 

19.57 

Citi-Group 

86/10/30 

4333 

0.110 

2.289 

-0.10 

6.79 

-21. 74 

20.76 




ij 刈数收 & 率 （％) 




SP 

62/7/3 

10446 

0.029 

0.951 

1.41 

36.91 

22.D0 

8.71 

VW 

62/7/3 

HM46 

0.041 

0.895 

-1,06 

23.91 

-18.80 

8.31 

EW 

62/7/3 

10446 

0.082 

0.728 

-1.29 

14.70 

-10.97 

6.72 

IBM 

62/7/3 

1044(5 

0.039 

1.649 

-0.25 

12.60 

一 26,09 

12.37 

Intel 

72/12/15 

7828 

0.086 

3.013 

一 0.54 

7.54 

-35.06 

23.41 

3M 

62/7/3 

1Q446 

0.044 

1.469 

0.69 

20.06 

30.08 

10.02 

Microsoft 

86/3/U 

4493 

0.126 

2.518 

-0.73 

13.23 

-35.83 

17.87 
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( 续） 

证券 

起始曰期 

样木 i 

均值 

标准筹 

偏度 

超 额蛑度 

M 小值 

敁大值 

Citi-Group 

86/10/30 

4333 

0.084 

2.289 

一 0.21 

7.47 

-24.51 

18.8“ 




月简单 收益宰 . （％) 




SP 

62/1 

936 

0.64 

5.36 

-0.35 

9.26 

一 29.94 

42.22 

VW 

26/1 

936 

0.95 

5.49 

-0.18 

7.52 

-28.98 

38.27 

EW 

26/1 

936 

1.31 

7.49 

一 1.54 

14.(54 

—31.18 

65.51 

IBM 

26/1 

936 

1.42 

7.11 

-0.27 

2.15 

-20.19 

35.38 

Intpl 

73/1 

372 

2.71 

13.42 

-0.26 

2.43 

一 44.87 

(i2.50 

3M 

46/2 

695 

1.37 

6.53 

-0.24 

0.96 

-27.83 

25.80 

Microsoft 

86/4 

2J3 

3.37 

11.95 

-0.53 

1.40 

-34.35 

51.55 

Citi-Group 

86/11 

206 

2.20 

9.52 

-0.18 

0.87 

-34.48 

26.08 




月对数收益 _ (%) 




SP 

26/1 

936 

0.48 

5.62 

-0.50 

7,77 

一 35.58 

35.22 

VW 

26/1 

93C 

0.79 

5.48 

-0.54 

0.72 

-34.22 

32.41 

EW 

26/1 

036 

L04 

7.21 

0.20 

8.40 

一 37.37 

60.38 

IBM 

26/1 

936 

1.16 

7.02 

-0.15 

2.04 


30 29 

Intel 

73/1 

372 

1.80 

13.37 

-0.60 

2.90 

-59.64 

48.55 

3M 

46/2 

695 

1.16 

6.43 

-0.()6 

1.25 

-32.61 

22.95 

Microsoft 

86/4 

213 

2.66 

11.48 

一 0.01 

1.19 

-42.09 

41.58 

Citi-Group 

86/11 

206 

1.73 

9.55 

-0.65 

2.08 

-42.28 

23.18 


a 收益率是 S' 分比，取样期截止到 2003 年 12 月 31 日 . 统计 S 分別由 (1.10) - (1.13) 式定义 . VW, 
EW 和 SP 分别表示价值加权指数 . 等权霞指数和标准普尔 (S&P) 复合 指数 . 


SCA 演示 

% 表示注释. 


input date, ibm r vw, ew, sp. file 1 d-ibmvwewsp6230.txt 1 
•/• Load data into SCA and name the columns date f 
•/• ibm, vw, ew, and sp. 

ibm=ibm*100 Compute percentage returns 
desc ibm •/• Obtain descriptive statistics of ibm 


VARIABLE NAME IS IBM 
NUMBER OF OBSERVATIONS 10446 
NUMBER OF MISSING VALUES 0 


MEAN 

VARIANCE 


STATISTIC 

STD. F.RR0R 

STATISTIC/S.E. 

0.0523 

0.0161 

3.2457 

2.7163 
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STD DEVIATION 

1.6481 

C.V. 

31.4900 

SKEWNESS 

0.0775 

KURT0STS 

10.2144 


qUARTILE 

MINIMUM 

•22.9630 

1ST QUARTILE 

-0.8380 

MEDIAN 

0.0000 

3RD QUARTILE 

O.GOOG 

MAXIMUM 

13.1640 


0.0240 

0.0479 


RANGF. 

MAX - HTN 36.1270 

Q3 • Q1 1.7185 

S-Plua 演示 

>为 DOS 提示符，％表示注释. 

> module (finmetrics) •/• Load the Finmetrics module. 

> x=matrix(scan(f ile =, d-ibmvwewsp6203. txt J ) t 5) •/• Load data 

> ibm=x[2,j*100 •/• compute percentage returns 

> summE^yStats(ibm) •/• obtain summary statistics 


Sample Quantiles; 

min IQ median 3Q max 

-22.96 -0.838 0 0.8807 13.16 


Sample Moments : 

mean std skewness kurtosis 
0.05234 1.648 0.0775 13.22 


Number of Observations: 10446 

1.2.2 收益率的分布 

对数收益率 = 的最一般的模型是它们的联合分 

布 函数： 

K (m, ••- ， nvi;n 2 ， ". ， nv 2 ;... - • - r ^ r ： V ^： 0), (1.14) 

其中 K 是由一些变量组成的状态向量.这些变量描述了决定资产收益率的环境 . 0 
是唯一决定分布函数 fV (•) 的参数向量.概率分布忍 （•） 决定了收益率/ V 和 y 的 
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随机 行为. 在许多金融研究中.把状态向量当作给定的，而主要关心的是给定 y 的 
条件下 {〜} 的条件分布. 因此. 资产收益率的实证分析是要估计未知参数0，并在 
给定一些过去的对数收益率的条件下对{^}的行为做出统计推断. 

(1.14) 式的模型太广泛了，以至于失去了实际应用的价值.然而，它却提供了一 
个一般的框架.在此框架中.可以给资产收益率建立一个适当的计量经济模型 

有些金融理论，比如 Sharpe 1064 年提出的资本资产定价模型 (Capital Asset 
Pricing Model . 简记为 CAP \ f )、 考虑的是在单个时间点，上 W 个收 益率的 联合分 
布（也即的分 布). 另外一些理论则强调申个资产收益率的动态结构 
(也即对一个给定的资产*•， { ru ，… , rm } 的分 布). 本书对这两个方面都给予了充 
分的讨论.在第 2 〜 7 章的一元分析中.主要关心的是对资产*， { r lt } J = l 的联合分布. 
为此，把联合分布分解成如下形式 

^ ( r *i 1 • • * ， nr; 沒） = F(r 1 i)F(r 1 ； 2|rn)*--/ r (rjT|r,.r-i, ••- ,r u ) 

T 

= F ( ra ) JJ F ( r it | r M _ i , •• - , ni ). (1.15) 

为简单起见,上式中略去了 0. 这个分解式突出了对数收益率在时间上的前后相 
依性. 因此,主要的问题就是条件分布 F ( r it \ r u ^ u ) 的具体形式.特别是条件分布 
是怎样随时间演变的.在金融中，不同分布的具体形式会导出不同的理论.例如，随 
机游动假定的一种形式就是条件分布 F ( r tt , r n ) 等于边际分布 F ( r it ). 

这时，收益率在时间上是相互独立的.从而是不可预测的. 

我们通常把资产收益率当作连续型随机变量对待.尤其是对低频的指数收益率 
或股票收益率.因此这里我们使用它们的概率密度函数.在这种情况下，利用等式 
(1.9), 我们把 (1.15) 式的分解写成 


/ ir iT ;0) = f {ru\0)Y\f (r it — … ,r<j.0). (1.16) 

t =2 

对高频资产收益率.离散性就变成一个问题.例如，在纽约股票交易所 (New York 
Stock Exchange , 简记为 NYSE ), 股栗的价格是以个微小量 (tick size ) 的倍数变 
化的.这个微小量在1的7年7月之前取为 I / 8 美元，而在1997年7月至2001年 
1月是1/16美元.因此， NYSE 记录的个股的收益率不是连续型的.我们将在第5 
章讨论高频的股价变化和在价格发生变化之间的 N 间持续期. 

注释： 20( K ) 年8月28日，纽约股票交易所开始了一项试验性的程序，对7 
只股票以十进制小數计价，而美国股票交易所 (American Stock Exchange , 简记为 
AMEX ) 开始对6只股票和两种期权种类以十进制小数计价.在 20()0 年9月25日 
和12月4日， NYSE 分别增加了 57只股票和94只股票进入该程序. 2001年 i 月 
29 9,所有在 NYSE 和 AMEX 交易的股票都以十进制进行交易. 口 
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(1.1 G ) 式启示我们在资产收益率的研究中，条件分布比边际分布更有意义.然 
而.边际分布仍然需要关注，特别地,利用过去的收益率数据.估 ilii 际分布比估计 
条件分布更容易.另外，有时通过实证看出资产收益率只有很弱的序列相关性，从 
而它们的边际分布与条件分布很相近 

在对资产收益字的边际分布进行研究的文献中，己经提到过几种分布，包括正 
态分布，对数正态分布，稳定分布和正态分布的尺度混合 (scale mixture ). 下面我 
们简要讨论一下这几种分布. 

正态分布 

金融研究中传统的假 设是： 简单收益率 {/?,, 是独立同分布的, 
均服从一个固定均值和方差的正态分布.这个假设使资产收益率的统计性质变得可 
以处理，但它遇到几个 困难： 第一，简单资产收益率的下界为-1，而正态分布可以 
取到实数轴上的任何值.从而没有 下界； 第二，如果凡，是正态分布的，那么多期的 
简单收益率 R, t [/ t ] 就不再是正态分布的，因为它是单期收益率的 乘积；第三， 实证 
结果不支持正态性假设.很多资产收益率数据都具有正的超额峰度 

对教正态分布 

另一个常用的假 定是： 资产的对数收益率是独立同分布的且都服从均值为//.、 
方差为 a 2 的正态分布.那么在此假定下，简单收益率是独立同分布的对数正态分 
布的随机变量，均值和方差分别为 

E(/? t ) = exp — 1. Var [R,) = exp (2fi a 2 ) [exp (o- 2 ) - 1]. (1.17) 

上式在研究资产收益率时是有用的（如利用给对数收益率所建立的模型进行预测 
时).反之.假设简单收益率吊服从对数正态分布.均值为 mi 方差为 m 2 , 则对应 
的对数收益率 n 的均值和方差分别为 




因为有限个独立同分布的正态随机变儀之和仍服从正态分布.在 { r ,} 的正态 
假定 F / •< [ A :] 也是正态的.另外，没有下界，并且由1 H = cxp | r t 丨知的 
下界也能满足.然而，对数正态假定并不是与股栗的历史收益率的所有性质都一致 
的，特別是很多股粟收益率表现出了正的超额峰度. 

稳定分布 

稳定分布是正态分布的自然推广，它们在加法运算下是稳定的，这一点符合连 
续复合收益率 n 的要求.进一步讲.稳定分布能刻画股票的历史收益率所显示出 
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来的超额峰度.然而.非正态稳定分布没有有限方差，这一点与大部分金融理论相 
矛盾.另外.用非 If 态的稳定分布进行统计建模是很困难的_非正态稳定分布的一 
个例子是何西 ( Cauchy ) 分布.其中关于它的中位数是对称的，但方差是无限的. 


正态分布的尺度混合 

对于股票收益率的新近研究.倾向于利用正态分布的尺度混合或有限混合.在 
正态分布尺度混合的假定下，对数收益率服从均值为/，、方差为 d 的正态分布 
(也即 n 〜 ；V (//, a 2 )). 但是， rr 2 是一个随机变量.它服从一个正的分布（如 a - 2 服 
从一个伽玛分布).正态分布的有限混合的一个例子是 

r t 〜 （1 -X)iNT(/i,of) + XN(^al), 

其中 X 是服从伯努利分布的随机变量，即 P(X = 1) = a . P(X = 0) = 1 - r >. H 
0 < a < 1, a ? 较小而 or | 相对较大.例如，对 o = O . Ofi . 有限混合指的是95%的收 
益率服从 iVh . d )， 5%的收益率服从 AT aj 的较大值使混合把更多的“质 

量”放在其分布的尾部.来自于 N {^ nl ) 的收益率的&分比 较低， 表明大多数收益 
率服从一个简单的正态分布.正态分布有限混合的优点 包括： 保持了正态分布的易 
处理性、具有有限髙阶矩和能刻画超额峰度.然而，我们很难估计混合参数（如有 
限混合中的 

图1-〗显示的是正态分布的有限混合、柯西分布和标准正态分布的概率密度 
函数.正态分布的有限混合是 （1 - X)N (0.1) + IV (0,1(5)， 其屮入 为满足 l J {X = 
i ) = 0.05 的伯努利随机变童.柯西密度函数是 

可见.柯西分布有比正态分布的有限混合更厚的尾部，而正态分布的有限混合有比 
标准正态分布更厚的尾部. 



图 1-1 汜态分布的有限混合、稳定分布和标准 1 F . 态分布的密度函数的比较 
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1.2.3 多元收益率 

设=(⑺，…，以以是 iV 个资产在 t 时刻的对数收益率.第8章和第9章 
的多元分析将涉及 { r ,) r = l 的联合分布.这个联合分布可以用与 (1.15) 式相同的方 
式来分解，因此分析集中在条件分布厂(心 | f ,, r t ,0) 的具体形式上.特别地， 
r , 的条件期望和条件协方差阵怎样随时间演变是第8章和第9章讨论的主题. 

随机向量 JV = ( X u --- , X P ) 的均值向量和协方差矩阵定义为 

E ( X )= Ma; = [ E ( X 1 ),*-- 1 E ( X p )] / , 

Cov ( X ) = J： x = E [( X - Mx ) (X - Mx ) T ， 

假定 X 所涉及到的期望是存在的.当有米自于 A 的数据 { m ... 时.样本 
均值和样本协方差阵定义为 

T T 

Ax = ^ 51 x, ' 公 r = j- ^ (a?f - Ax) (Xt - il m )'■ 

1 t=l ~ 1 t=l 

假定 X 的协力差矩阵存在.则这些样本统计量都是它们对应的理论值的相合估计. 
在金融文献中，多元止态分布常用来描述对数收益率 r t . 

1-2.4 收益率的似然函数 

(1.15) 式的分解可用来得到一个资产的对数收益率 { n ,--- , r T } 的似然函数.这 
里为了符号 h 的简便，对数收益率中的下角标 i 省略不写.若条件分布 /( relrt -,,... , 
ru 0) 是均值为川、方差为疗的正态分布，则0由参数川和 < 组成.数据的似然 
函数为 

/ (n ， … ， rr;0) = / (ri ； 0)H ^expL ， ⑷ 18 ) 

l 一 2 L . 

其中 /( r ,；0) 是第-个观测 n 的边际密度函数.使似然函数达到最大值的0的值 
就是参数0的最大似然估汁 （ MLR ). 闲为对数函数是单调的. MLE 可通过最大化 
如下对数似 然函数得到： 

T 「 2 • 

ln /( ri , ••- , r T ；0) = luf ( ri ；0) - In (2 ji ) -f In ( af ) + — ~^ - . 

Z <-2 L A . 

对数似然函数在实际中更容易处理一些.若条件分布不是正 
态的，则数据的对数似然函数可用类似的方式得到. 
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1.2.5 收益率的经验性质 

本节所用数据是从芝加岢大学证券价格研究中心 ( CRSP ) 得到的.如果有分 
红支付，则它也包含在收益率之中了.图 1-2 显示的是 IBM 公司股票从1926年 
1月到1997年12月的月简单收益率和对数收益率的时间图 (time plot ). 时间图 
显示的是对应于时间的数据.上方的图表示简单收益率.图 1-3 显示的是价值加权 
( value - weighted ) 市场指数的月简单收益率和对数收益率的时间图.如所期望的一 
样,这些图表明简单收益率和对数收益率的基本模式相似. 




价值加权屯场指数从1926年1月到 2(103 年12月的月收益率的时间图. 
上方的图是简单收益率，下方的图是对数收益率 


1 BM 股票从1926年丨到1997年1‘2月的月收益率的时间图. 
上方的图是简单收益率，下方的图是对数收益率 




().21 
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表 1-2 列出了所选的美国股票市场指数和个股的简单收益率和对数收益率的 
一些描述性统计量的值.所列收益率是日收益率和月收益率.它们的值以百分比给 
出.所用数据的时间跨度和样本容量大小也在表中给出.从这个表中我们观察到如 
下几点 ： （ a ) 市场指数和个股的円收益率具有很高的超额峰度.而对月收益半序列. 
市场指数的月收益率的超额峰度比个股的月收益字的超额峰度高出 许多； （ b ) 日收 
益率的均值接近于零.而月收益率的均值要稍大 一些； （ c ) 月收益率比日收益率有 
更大的标 准差； （ ci ) 在日收益率中，市场指数的标准差比个股的标准差小，这一点与 
通常的感觉是相 符的； （ e ) 偏度不是一个严重问题，对日收益率和月收益率都是如 
此； （0 描述性统计量表明简单收益率和对数收益率的差别很小. 

图 1-4 显示的是 IBM 股票的月简单收益率和对数收益率的经验密度函数.在 
每个图中，虚线是由表 1-2 中的 IBM 收益率的样本均值和样本标准差决定的正态 
概率密度函数.图像表明对 IBM 股票的月收益率作正态性假定是值得尚榷的.经 
验密度函数与对应的正态分布密度函数相比，在均值附近有吏高的峰.但尾部更厚. 
换句话说.与正态密度相比，经验密度函数更高、更瘦，但有更宽的支撑. 



阁 1-4 IBM 股票的月简巾收益率和月对数收益率的经验密度函数和正态密度函数的比较.取 
样闩期仍然是1926年1月到2003年 I 2 月.左边的图是关于月简争收益率的，右边 
的图是关于对数收益率的.虚线给出的 If 态密度由表1-‘2屮给出的样本均值和样本标 
准差决定 


1.3 其他过程 


除了收益率序列以外.我们还考虑波动率过程和资产极值收益率的行为.波动 
率过程研究的是收益率的条件方差随时间演变的规律.这是一个有趣的问题.因为 
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如图 1-2 和图 1-3 所示的那样.收益率变化的大小随时间变化且呈现出聚类现象. 
在应用中，波动率在期权定价和风险管理中起重要作用.收益率序列的极值指的是 
绝对值人的正或负的收益率.表 1-2 说明收益率序列的最大值和最小值是不可忽视 
的.负的极值收益率在风险管理中很重要，而正的极值收益率对持有空头头寸是至 
关甫要的.我们将在第7章中研究极倌收益率的件质和应用，例如极值发牛的频 
率、极倌的大小和经济变量对极值的影响等. 

本书考虑的其他金融时间序列包括利率、汇率、债券收益率、公司每股的季度 
贏利.图 1-5 所示的是美国两种月利率的时间图，分别是从1954年4月至 2()04 年 
3月间的10年期和1年期具有固定期限的国库券利率.正如我们所期望的，这两 
种利率的变化基本同步，但1年期利率的波动程度要更大一些.图 1- G 给出了 2000 
年1月到2004年:3月间的美元对日元的日汇率时间图.从图中可以看出，在取样 
期间.外汇遇到了偶尔发生的大变化.表】 -3 给出了一些美国金融时间序列的描述 
性统 II 景的值，其中从 CRSP 得到的债券的月收益率是 Faina 债券组合的收益率, 
时间是从1952年 I 月到年12月.利率数据是从圣.路易斯联邦储备银行 
(Federal Reserve Bank of St . Louis ) 得到的 ，3 个月国库券的周利牟从1954年1月 
8 Id 开始 T 6个月国库券的周利率则从1958年12月12日开始.这两个序列的截止 
日期都是2004年4月9日.对利率序列而言，期限越长，样本均值越大.而样本标 
准差越小.对债券收益率序列而言，样本标准差与期限长度正相关，而样本均值对 
所有期限保持稳定.这里所考虑的人部分序列具有正的超额峰度. 


(») 




W 1-5 1954 年 4 月到 2004 年 3 月美国的月利字的时间图 ， （ a) 10 年期阁定期限国库券利 

( b ) 1年期固定期限围库券利率 
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图 1-6 2000年1月3日到2004年3月26日间的美元对日元的 H 汇率时 间图: 
( a ) 汇率： （ b ) 汇率的变化 


表 1-3 某些美国金融时间序列的描述性统计量° 


期限 

均值 

标准差 

偏度 

超额峰度 

最小值 

最大值 


愤券的《收益平 .： 1952年1月至2003年12片， T =624 


1-12 月 

0.47 

0.36 

2.43 

12.67 

-0.40 

3.52 

24 〜 36月 

0.53 

0.99 

1‘40 

12.93 

-4.90 

9.33 

48 〜 60月 

0.53 

1 42 

0.62 

4.97 

5.78 

10.0 C 

(51 〜120月 

0.55 

1,71 

0.63 

4 .KR 

一 735 

10.92 


国堆券月 利率： 1953年4月至2004年3月， T = 

=612 


1年 

5.80 

3.01 

0.96 

1.27 

-0.82 

16.72 

3年 

6.21 

2.86 

0.89 

0.81 

一 1.47 

16.22 

5年 

6.41 

2.79 

0.88 

0.67 

-1.85 

15.93 

J 0 年 

6.60 

2.73 

0.83 

0.42 

-2.29 

15.32 



国阼券周利率 

:截11: 2001年2月16日 



3个月 

5.51 

2.76 

1.14 

1.88 

-0.58 

16.76 

6个月 

fi 08 

2.56 

1.26 

1.82 

-2.35 

15.76 


a 数掂的值是百分比 • 3个月期 S 库券的周利率起始时间是1954年1 8日，6个月 W 库券起始时间 

为1958年12月12 I I . 正文中已给出了数据来源. 


关于表 1-2 所示的收益率的经验特征.第2〜4章的内容涉及收益率序列的前 
四阶矩，第7章讨论收益率最小值和最大值的行为，而第8章和第章研究多个 
资产收益率的矩及它们之间的关系•第5章讨论当时间区间很小时资产收益率的 
性质.第 G 章介绍了数理金融的基本内容. 



(a) 
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练习题 

1.1 考虑如下公司股票从1994年1月到2003年12月的日收益率 ： American Express ( axp ), 
Caterpillar ( cat ) 和 Starbucks ( sbux ). 文件 d -3 stock . txt ( date , axp , cat , sbux ) 给 
出 r 简单收益率数椐 

( a ) 将简单收益举用百分比表示出来.计算简申-收益韦百分比的样本均值、样本标准差、 
样本偏皮、样木超额峰度.最小值和最大值. 

( b ) 把简单收益率转换成对数收益率 • 

( c ) 将对数收益率用百分比表示出来.计算日对数收益率百分比的样本均值，样本标准 
差、样本偏度、样本超额峰度.巖小值和最大值 

( H ) 对毎只股票的对数收益率进行零均倌检朌（讲行三次独立的检验).对数收益率的样 
本均值是显著地不同亍零吗？在5%的显著性水平 F 得出你的结论. 

1.2 考虑从1975年1月到2003年12月间的 IBM 股票、 CRSP 价值加权指数 （ VW)、CRSP 
等权電指数 ( EW ) 和标准普尔综合指数的月收益率，軍:新回答练习题 1.1 的所有问题.指 
数收益率已包含分红.数据文件是 rn - ibin 3 dx 7503. txt . 

1.3 考虑练>』题 1.2 中从1975年1月到 20 U : i 年12月的标准普尔复合指数的月收益率.回 
答下述 问题： 

( a ) 在数据取样期间内， 52 均年对数收益率是多少？ 

( b ) 假定没有交易费用.如来某人于1975年初在标准普尔综合指数上投资1美兀，那么 
到2003年底该投资的价值是多少？ 

1.4 考忠练题 L 1 中从1994年1月到2003年12 月间的 American Express ( axp ) 股票 
的 U 收益率.在5%的显著性水平下进行下述检验. 

( a ) 检验收益举的偏度为零的零假设是否成立. 

( b ) 检验收益率的超额峰度为零的零假设是否成立. 

1.5 可在芝加哥的联邦储备银行得到每天的外汇汇率数据是由纽约的联邦储备银行认证的纽 
约市场上的中午买入价.考虑从 2() fX ) 年丨月到2004年3月间的加拿大元、欧元、英镑 
和日元对美元的汇率. 

( a ) 计算每种汇率序列的日对数收益率. 

( b ) 计算每种汇率对数收益率序列的样本均值、样本标准差、样本偏度、样本超额峰度、 
最小值和最大值. 

( c ) 讨论这些汇率的对数收益率序列的经验特征. 
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第 2 章线性时间序列分析及其应用 

本章讨论线忡时间序列分析的基本理论，介绍一些对分析佥融时间序列有用的 
简单计量经济模型，并将这些模艰应用于资产收益率.我们重点讨论了与金融应用 
有关的概念. 理 解本章所介绍的简单时间序列模型对掌握以后各章中更复杂、 更深 
入的金融计董模型是必要而有 益的. 我们已有许多时间序列的教科书可供 参考对 
线性时间序列分析的基本概念，可参见 Bux，Jenkins 和 Reinsel (1994) 的第2章和 
第3章.以及 Brock well 和 Davits (1996) 的第〗〜3章. 

把资产收益率（如股票的对数收益率， v ) 看成随时间推移而形成的一族随机 
变量，我们就有了一个时间序列 { r t }. 线性时间序列分析提供了一个自然的框架， 
来研究这种序列的动态 结构. 本书所讨论的线性时间序列的理论包括平稳性、动 
态相依性' 自相关函数、建模和预测.另外，本书所介绍的经济计量模型包括 ： （a ) 
简单自回归 （ AR) 模型； （ b) 简单滑动平均 (MA) 模型； （ c) 混合的自回归滑动平均 
(ARMA) 模型； （ cl) 季节 模型； （ e) 单位根非平稳性 ： （ f) 带时间序列误差的回归模 
(g) 刻画长相依性的分数阶差分 模型. 对资产收益率 r< ， 试图用简单模型来刻 
画 r , 与/时刻之前所拥有的信息之间的线性 关系. 这里的信息可以包括的历史 
值和 （1.1.1 ) 式中的这个 y 是描述决定资产价格的经济环境的.同样地 ：相关 
系数 (correlation) 在理解这些模型中起着重要作用.特 别地. 所研究的变量与其过 
去值的相关系数成为线性时间序列分析的 焦点. 这胜相关系数称为序列相关系数 
(serial correlation) 或自相关系数 (autocorrelation), 它们是研究平稳时间序列 
的基本工具. 


2.1 平稳性 

平稳性是时间序列分析的基础.时间序列 { rt} 称为严平稳的 (strictly sta¬ 
tionary), 如果对所有的《，任意正整数和任意 A : 个正整数 ( ti ,-- - , t k ) y ( r tl .... ， 
rtj 的联合分布与 （ r <1+< ，… , r tk + t ) 的联合分布是相问的.换言之，严平稳要求 
(%，••• , r lk ) 的联合分布在 H 、 j 间的平移变换下保持小变.这是一个很强的条件，难 
以用经验方法验证，经常假定的是平稳性的-个较弱的形式.时间序列称为 
弱平稳的 (weakly stationary), 如果的均值与和的协方差不随时间而 
^变，其中 Z 是任意整数.更具体地说， { r < } 是弱平稳的，若 ( a ) Er t = / v , M 是一个 
常数； （ b ) Cov %只依赖于 /. 在实 际中， 假定我们有 r 个数据观测点 

{r t |/ = 1,... , T }, 弱平稳性意味着数据的时间图显示出 T 个值在一个常数水平上 
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下以相同幅度波动.在应用中，弱平稳性使我们可以对未来观测进行推断，即预测 - 

在弱平稳性的条件中，我们隐含地假定了 n 的前两阶矩是有 限的. 由定义可 
见，若 O 是严平稳的且它的前两阶矩是有限的.则也是弱平 稳的. 反之，一般是 
不成立的.但如果时间序列 r , 是正态分布的，则弱平稳性与严平稳性是等价的.本 
书主要考虑弱平稳序列. 

协方差％ = Cnv(r t ,r t ,) 称为 r, 的间 隔为/ 的自协 方差. 它具有两个重要 
性质： (a) 7 o = Var(r t ); (b) T ,=li 第二个性质成立是因为 Cov (n,r t _ ( _ 0 )= 
Cov — Cov(r t 十 “rt) = Cov 其中 ti = t + l. 

在佥融文献中，通常假定资产收益率序列是弱平稳的.只要有足够多的历史收 
益率数据.这个假定可以用实证方法验证.例如，我们可以把数据分成若干子样本， 
然后检验它们的一致性. 


2.2 相关系数和自相关函数 


两个随机变量 x 和 r 的相关系数定义为 

_ Cov (X, Y) E[(X-/i x )(y-Mv)] 

Px ' v - v/Var (X) Var (Y) ~ ^(X- ^) 2 E(Y - n y ) 


其中和 ~ 分别表示 X 和 K 的均值，并且假定方差是存在的.这个系数度量的 
是 X 和 V 线性相义的 程度， 可以证明 — 1 < 矣1且 Pi,y = Py ，*. 若 Pi;,y = 0, 
则这两个随机变量是不相关的.另外，若 x 和 Y 都是正态随机变量，则心 , w = 0 
当且仅当 x 和 V 是相互独 立的. 当我们有样本时，相关系数可以由 
它对应的样本相关系数相合地估计出来： 

= Ef=i ( J ( - £ ) (yt - y) 

Px v 忙:' 

其中无 = /T, y= IT 分别是 X 和 y 的样本均值 . 

自相关函数 ( Autocorrelatiui 1 Fiaurtiuii. ACF) 


考虑弱平稳收益率序列〜当我们考虑 n 与它的过去值的线性相依关系 
时，可以把相关系数的概念推广到自相关系数 . r t 与 m 的相关系数称为 r t 的间 
隔为/的自相关系数.通常 记为郎 在弱平稳性的假定下它只是/的函数.具体地说. 


定义 


Pi = 


Cov (7.t ， r t -f) 
yVarCrt) Vai (r, /) 


Cov(rt ， r t -i) _ 21 
Var (r t ) 7o ， 


( 2 - 1 ) 


这里用到了弱平稳序列的性质 Var(r,) = Var(r ( _i). 由定义，我们有 A) = 1 . Pi = 
p_ t 和 - 1 < < i . 另外，一个弱平稳序列是序列不相关的当且仅当对所有 Z > U 
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都有内= 0. 

对一个给定的收益率样本 { r / =11 设 f 是样本均值，也即 r =(是"•，则 
rt 的间隔为1的样本自相关系数为 



在某些一般性条件下，以是 Pl 的相合 估计. 例如，若 { rt } 是独立同分布 （ iid ) 序列 
且 E ( rf ) < oo , 则&渐近地服从均值为（)、方差为 1/ r 的正态分布（见 Brockw^ll 
和 Davis (1991) 的定理 7.2.2). 在实际中，这个结果可用来检验原假设 H 0 : Pl = 0 
和备择假设 Ha ■ Pi ^ 0. 检验统计量就是通常的 f 比，即 v / Tp ,, 它渐近地服从标 
准正态分布.一般地， r , 的间隔为/的样本自相关系数定义为 



( r t - r) (r t ~i — r) 
Ef = i ( r t - f ) 2 


o < / 5$ r - i . 


( 2 . 2 ) 


若 { r t } 是一个独立同分布 序列， 满足 E ( rf ) < oo , 则对任意固定的正整数/，命渐 
近地服从均值$ 0、方差为 1/：/' 的止态 分布. 史一般地，若 rt 是一个 弱平稳序列， 
满足 r , = 其中 ip 0 = l r q 为非负整数.{心}是高斯白噪声序列，则对 

1 > Pi 渐近地服从均值为0、方差为^1 + 2 /' J -' 的止态分布.在时间序列 

的文献中，称此结果为 Bartlett 公式（参见 Box , Jenkins 和 Reinsel (1994)). 关于样 

本自相关函数的渐近分布的更多信息，参见 Fuller (197 G ) 的第6章和 Brockwell 和 
Davis (1991) 的第7章. 

检验单个 ACF 


对—个给定的正整数/，可用前面的结果来检验// 0 :内= 0和 f/ a :内# 0检 
验统计量为 

i-ratio =― 〆 

V( 1 +2E^ 1 1 P?)/T 

如果 { n } 是一个平稳高斯序列并且满足当 _?• > /时巧= 0,则该比渐近地服从 
标准 if 态分布-决策规则是：当 卜比| > 2： a /2 时拒绝的，其中 z a/2 是标准正态分 
布的 100(1 -«/2)分位点. 

对有限怦本， A 是內 的有偏 估计. 偏差的阶是 i / r , 这在样本容量 r 较小时是 
不容忽 视的. 但在大多数金融应用中， t 相对较大，故这个偏差并不严重. 

混成检验 （Portmanteau Test ) 

金融应用中常需要检验 r t 的几个自相关系数是否同时为零 . Box 和 Pierce 
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(1970) 提出了“混成”检验统计量 

771 

Q. (m) = T^p? 

来检验原假设 ： ^! = • •. = / j m = D 和备择假设 // a :对某，+ C {1, ••- , rn } . /u 0. 
在 { r ,} 为满足一定矩条件的独立同分布序列的假定下， g * ( m ) 渐近地服从自由度 
为 m 的 x 2 分布. 

Ljuug 和 Box (1078) 为了提高有限样本时检验的功效把统计量 Q * ( m ) 修改为 

m ^2 

Q ( m )= T ( T -^ 2 )^^- (2.3) 

决策规则 是：当 Q ( m ) > 时柜绝 // o , 其中是自由度为 m 的 x 2 分布的 
10 U (1 - a ) 分位点.大部分软件包都会给出 Q ( m ) 的 p 值.决策规则 是：当 p 值小 
于等于显著性水平 a 时拒绝 H 0 . 

在实际中， m 的选择会影响 Q ( m ) 的表现.常用到儿个 m 值. 模拟研究表明， 
取 m « hi ( r ) 会有较好的功效.在分析季节性时间序列时.这个一般性的规则需要 
修正.因为此时间隔为季节性周期的倍数的自相关系数是很重要的. 

由 (2.2) 式定义的函数 pi , p 2 ,->- 称为 n 的样本自相关函数 （ ACF ). 这个函数 
在线性时间序列分析中起着重要作用.事实上，一个线性时间序列模型可完全由其 
ACF 决定，并且线性时间序列的建模用样本 ACF 来刻画数据的线性动态关系.图 
2-1 所示的是 IBM 股票从 192 G 年1月至1997年12月间的月简单收益率和对数 
收益率的样本自相关函数.这两个样本自相关函数非常接近.都表明即便 [ BM 股 
票收益率有序列相关性.其相关性也很小.两个样本 ACF 的值均在两个标准差之 
内，说明在5%水平下它们与零没有显著差别此外，对于简单收益率， Ijung-Rox 
统计量为 Q (5) = 5.4, Q (10) - 11.1, 对应的值分别为 0.37 和 0.17( 基于自由度 
为5和10的 X 2 分布).对于对数收益率 , Q (5) = 5.8, Q (10) = 13.7, p 值分别为 
().33 和 0.19. 这就证实了 I 13 M 股票收益率没有显著的序列相关性.图 2-2 所示的 
是价值加权指数（该数据来自芝加母大学的 CRSP ) 的月收益率的两个同样的函数, 
在5%水平 F 这两个收益率序列都存在某些显著的序列相关性.对于简单收益率， 
Ljiuig-Box 统计量为 Q (5) = 27.8, Q (10) = 36.0; 而对于对数收益率 ， Q (5) = 26.9, 
g (10) = 32.7 .这4个检验统计量的 p 值都小于 U.UUU 3,表明价值加权指数的月收 
益率是序列相关的.因此.市场指数的月收益率要比个股的月收益举有更强的序列 
相关性. 

在金融文献中，资本资产定价模型 ( CAPM ) 理论的一种形式就是假定资产收 
益率序列 { n } 是不可预测的，且没有自相关性.零自相关系数的检验被用来作为有 
效市场假定是否成立的判定工具.然而，股价的决定方式和指数收益率的计算方式 
可能会导致在观察到的收益率序列中有自相关性.尤其是在分析高频金融数据时. 
第5章将讨论此方面的问题. 
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(«) 简申收益率 



间隔 

( I *)对数收益率 



图 2-1 IBM 股票从1926年1月到1997年12月间的月简单收益率和月对数收益率的样本 
自相关函数.每个图中的两条横线表示样本自相关函数的两个标准差的上下限 


(») 简单 收益率 



间隔 

图 2-2 关国股栗市场价值加权拍数从〖 9 26年1月到 iyy 7 年12月⑽的月简单收益率和月 
对数收益率的杼本6相关函数.毎个图中的两条横线表示样本自相关函数的两个标 
准差的上下限 


SCA 演示 


给出了输出结果，％表示注释. 

input ibm. file # m-ibm2697.txt 


% Load data 
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acf ibm. maxi 10. % Compute 10 lags of ACF. 

NAME OF THE SERIES. IBM 

TIME PERIOD ANALYZED.1 TO 864 

MEAN OF THE (DIFFERENCED) SERIES . . . 0.0142 

STANDARD DEVIATION OF THE SERIES • . . 0.0670 

T-VALUE OF MEAN (AGAINST ZERO) . • . . 6.2246 

AUTOCORREIiATlONS % ACF (lag 1 to 10), Standard error, Q (m) 


1- 10 

.07 

.01 

-.02 

-.01 

-.01 

-.01 

-.00 

*07 

.05 

• 04 

ST.E. 

.03 

.03 

.03 

.03 

.03 

.03 

.03 

.03 

.03 

.03 

Q 

4.8 

4.9 

5.4 

5.4 

5.4 

5.5 

5 .S 

10.2 

12.6 

14.1 


p=l-cdfc(5.4,5) % Calculate p-value 

print p It Print p-value 

.369 


S-Plus 演示 

给出了输出结果. > 表示 DOS 提示符. 

> ibm=scan (f ile= 1 m- ibm2697 . txt : 9 ) % Load data 

> autocorTest(ibm,lag=5) % Perform Q(5) test 

Test for Autocorrelation : Ljung-Box 

Null Hypothesis : no autocorrelation 

Test Statistics : 

Test Stat 5.4474 
p.value 0.3638 

Dist. under Null : chi-square with 5 degrees of freedom 
Total Observ .； 864 

> ibm=log(ibm+1) % Convert into log returns 

> autocorTest(ibm # lag=5) 

Test Statistics : 

Test Stat 5.7731 
p.value 0.3289 

Dist. under Null : chi-square with 5 degrees of freedom 

2.3 白噪声和线性时间序列 

白噪声 

时间序列 { n } 称为一个白噪声序列，如果 { r ,} 是一个具有有限均值和有限方 
差的独立同分布随机变量序列.特别地.若 n 还服从均值为0、方差为 a 2 的正态 
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分布•则称这个序列为高斯白噪声.对白噪声序列，所有自相关函数为零_在实际应 
用中，如果所有样本自相关函数接近子零.则认为该序列是白噪声序列.基 T 图 2-1 
和图 2 - 2 , IBM 股票的月收益率接近白噪声，而价值加权指数的收益率不是白噪声. 

价值加权指数收益率的样本自相关系数的性质启示我们在对一些资产收益率 
进行更深入的分析之前，有必要对其序列相关性进行 建模. 下面我们讨论一些简单 
的时间序列模型，它们对时间序列的动态结构的建模非常有用，而且所述的思想在 
以后给资产收益的波动率建模时也是很有用的. 

线性时间序列 


时间序列 { r t } 称为线性序列，如果它能写成 

OQ 

r « + (2.4) 

其中//是 n 的均值 . 0。= 1, {〜} 是零均值独立同分布（假定 a t 的分布是合理定 
义的）的随机变量序列（也即 {〜} 是白噪声序列).我们在以后可以看出， a< 表示 
时间序列在 f 时刻出现了新的信息，因此常将〜称为时刻 i 的新息 ( innovaticm ) 或 
扰动 ( shock ). 本书中我们主要关心的是 a < 为连续型随机变量的 情形. 然而并不是 
所有金融时间序列都是线性的•第,1章将研究非线件件和非线性模型. 

在 （2.4) 式定义的线性时间序列中，系数也决定了 rt 的动态结构.在时间序 
列文献中这些系数称为 r , 的矽-权重若是弱平稳的，我们利用 { a< } 的独立性 
可以很容易得到 r t 的均值和方差 

E ( r t ) = "， y & r ( r t ) = (2.5) 

ti=0 

其中 4 是〜的方差•因为 Var ( r t ) < + 00 ,所以{喊}必须是收敛序列，即当 
i — oo 时 < — 0. 相应地，随着 i 的增大，远处的扰动对 r , 的影响会逐渐消 
失. 


r t 的间隔为 Z 的自协方差为 


li = Co \( r t , r t - i ) = E 


i) [ 

\i=0 








,) 


為 +/• 


(2.6) 




28 第 2 章线性时间序列分析及其应用 


因此，弈权重与 r t 的自相关系数有如下 关系: 


70 1 + Ei=i W 


/ > 0 , 


(2.7) 


其中咖= 1. 线性时间序列模型就是用来描述^的命权重的量经济模型和统 
计模型.对弱平稳序列而言，当， — oc 时灿 — 0,从而随着 f 的增加内收敛到 （)• 
对于资产收益率而言，这意味着.如问所期望的那样，当/较大 N ， 当前收益率 r t 刈 
遥远过去的收益率的线性依赖会消失. 


2.4 简单的自回归模型 

CRSP 价值加权指数的月收益率 r t 具有统计显著的间隔为 i 的自相关系数. 
这个事实说明延迟的收益率 rr 1在预测 n 时 UJ ■能会有用.利用这样的预测功用的 
一个简单模型是 

= </>0 + + a t , ( 2 . 8 ) 

其中沁,}是均值为0、方差为4的白噪声序列.这个模型与众所周知的简单线性 
回归模型有相同的形式，这里 r , 是因变量 . 是自变量.在时间序列的文献中， 
模型 (2.6) 称为一阶自冋归 ( AR ) 模型.或简称 AR (1) 模型.该模型也广泛地应用 
在随机波动率的建模中，只不过那时 r t 由它的对数波动率所代替.见第3章和第 
12 章. 

(2.8) 式中的 AR (1) 模型有若干类似于简单线性回归模型的性质.但是，这两 
个模型之问存在一些显著的差异，这一点我们将在以后讨论.这里我们需要注意到 
这样个事 实：由 AR (1) 模型可推得，在己知过 i 收益率 n - i 的条件下， 

E ( r t | r e _ i ) =加 + ( pin-u Var ( r t | r t _ i ) = Var ( a t ) =( t ^. 

也就是说，给定过去的收益字 r t !,现在的收益宇将以 0 o +0 ir t - i 为中心取值，标 
准差是 tr a . 给定 ny 条件下， r t 与 r t - t(t > 1) 无关，这是 AR (1) 的马尔可夫性. 
当然，有些情况下 ry 不能单独决定 n 的条件期望.此时需要更复杂一些的模型. 
AR (1) 模型的直接推广是 AR ( p ) 模型： 

rt = 0 o + + ... + < P P rt- P + (2 9) 

其中 p 是非负整数， {〜} 的定义跟 (2.8) 式中一样.这个模型 表示： 给定过去的数 
据时，过去的 p 个值 1, -- . p ) 联合决定 n 的条件期望. AR ( p ) 模型与以 p 
个延迟值作为自变量的多元线性回归有相同形式. 

2.4.1 AR 模型的性质 

为了有效地利用 AR 模型，有必要对它的基本性质进行研究.我们详细地讨论 
AR (1) 模型和 AR (2) 模型的性质.对一般的 AR ( p ) 模型本节只给出其 结果. 
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AR ( 1 ) 模型 

我们首先讨论 (2.8) 式定义的 AR (1) 模型的弱平稳性的充分必要条件.假定序 
列是弱平稳的.则 E ( r ,) = ".， Var ⑺ ） = 70 , Cov ( r t ,7>_ j ) = 7 j , 其中 / i . 70 是常数. 

是」的函数而与 （ 无关.我们容易得到序列的均值、方差和自相关系数.对 (2.8) 
式两边取期望，因为 E ( a t ) = 0, 所以 

E ⑹=命 0 + . 

在平稳性的条件下， E ( r t ) = E ( r t _ 1 ) = / i , 从而 


"一 00 十 01 " 或 E(r f ) = /t 


00 


- 4 >\ 


这个结果有两个 含义： 第一 1若也¥1,则 r , 的均值 存在； 第二，的均值为0 3 
且仅当如= () .闵此，对平稳 AR (1) 过程.常数项如与的均值有关，如== 0意 
味着 E ( r t ) - 0. 

我们利用如= (1 ^)//可以把 AR (1) 模型写成如下形式 


( 2 . 10 ) 


( 2 - 11 ) 


r t - fi = 0, (r t _i - /i) -f a t , 

重复代入，由上述方程可推得 

r t - /x= a t -h </>idt-i + <t>\a t -2 H - 

OO 

»=0 

因此， r < 一 / i 是 a t _ i , i > () 的线性函数，利用这个性质和 { af } 的独立性.我们有 
E [(r t - //) a t+1 J = 0. 由平稳性的假定，我们有 Cov (r t _!,a t ) = E [( r t _! - //) j = 0. 
此性质可从直观上看出来，因为 rt —〗 发生在 < 时刻之前而 at 不依赖于任何过去的 
信息•对 （2.10) 两边平方，然后取期望得到 

Var ( r £ ) = 0 ?Var ( r *_ i ) + 

其中 < 是 a , 的方差，这里我们用到“与的协方差为零”这样一个事实.而 
在平稳性的假定下， Var ( r ,) = Varh ^) ，故 


Var (r f ) 




i -的’ 


上式在 # < 1 时 成立. 因为方差是非负有限的，故要求 ^ < ] 这样，由 AR (1) 模 
型的弱平稳性可推得 -1 <也< 1. 反之，若 - 1 < 也< 1,由 (2.11) 式和序列 {« t } 
的独立性，我们可以证明 n 的均值和方差是有限的，参见 （2.5) 式.另外.由 (2.6) 
式， r , 的自协方差也是有限的.从而： AR (1) 模型是弱平 稳的. 综上所述， (2.8) 式定 
义的 An ( l ) 模型是弱平稳的充分必要条件是 1 和 1 < 1. 
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AR (1) 模型的自相关函数 

在 (2.10) 式两端乘以再取期望，利 用山与 的独立性，我们有 


E \ a t { r t - ii )] = E \ a t ( r t -\ - / i )] + E ( a ' f ) = E ( a ?) = a ^, 


其中 4 是 ~ 的方差.对 （2.10) 式两端同乘以 ( r £ _i - //), 取期望.再利用上述结果, 


我们有 


11 


<Pili H-^at 


当/ — 0时, 
当/ > 0时. 


这里利用了 K %这个性质.因此，对 (2.8) 式定义的弱平稳 AR (1) 模型，有 


Var ( r t ) = 7 o = 


且 H = i ? 


I > 0 . 


由后一方程， n 的自相关函数 ( ACF ) 满足 


pi — <hpi-u I > 0. 

因内 _ 1, 故有内 一 这个性质表明弱平稳 AR (1) 序列的自相关函数从如一 1 
开始以比率为和的指数速度衰减.对正的扣， AR (1) 模型的自相关函数 （ ACF ) 图 
像呈现漂亮的指数衰减.对负 的如， AR (1) 模型的 ACF 由上下两个都以的比率 
指数衰减的图像组成.图 2-3 所示的是当扣 — 0.8 和0: “ - 0.8 时的 AR .(1) 模型 
的 ACF 图. 


(a) 



(b) 



0 2 4 0 8 

NBS 


图 2-3 AR (1) 模型的自相关函数： （ a ) 如= 0.8; ( b ) = —0.8 
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AR(2) 模型 
AR(2) 模型形如 

ft = </>0 + + 4>2 r t-2 + Oj. 

利用与 AR(1) 情形相同的方法，我们得到：只要如+扣/ 1,就有 


E (7>) = "_ 



利用如= (1 - < f > i - < h )^ 我们可把 AR(2) 模型改写成 


r t - fi = 4> x (r t _i - /i) + 02 (r t -2 - /J) + a f . 

在上式两端同乘以 7* t _i - /X，我们有 


( 2 . 12 ) 


( r t~i — t l ) i r i. - /i) ~ 0i {r t ~i — /i) (r f _i — fi) + 4>2 (rt-i (jt) (r t _2 n)-\-(r t -i — fx) at, 

再取期望，并利用当 f > 0时 E[(r t _, - //) a t J = 0这个性质，我们得到 


11 = 01 7/- 1 + 027 Z -2, I > 0. 

这个结果称为平稳 AR(2) 模型的矩方程，在上式两端问除以 70 ,得到 r< 的 ACF 的 
性质： 

Pi = 4 > ipi-i + ( hPi - 2 , I > 0. (2.13) 

特别地，间隔为1的 ACF 满足 


Pi = 0i ^0 + < hP-i = 沴1 + 4 > 2 Pi - 
因此，对 平稳的 AR(2) 序列 r t , 我们有 

W = 

„ _ 

Pl = r ^’ 

Pi = 0iP/-i + <hPi-2, I ^ 2. 

(2-13) xC 的结果说 的是： 平稳 AR(2) 序列的 ACF 满足二阶差分方程 

— < f)\D — ( hD 2 ) pi = 0, 

其中 B 是向后推移算子.即 Sp, = pi - i . 这个差分方程决定了平稳 AR(2) 序列的 
ACF 的忡质，也决定了 r< 的预测行为.在时间序列的文献中，有时也用 L 而不是 
B 来表示向后推移算子.这里 L 表示延迟算子，如 i> t = r t _x, L^ k - V/t-L 
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与前而的差分方程相对应的是二次多项式方程 

1 — < p'x — = 0. (2.14) 

这个力程的解是 _ 

01 丄 十402 

1= ^ • 

在时间序列文献中，称这两个解的倒数为 AR ,(2) 模型的特征根.用 A 和 u ; 2 表示这 
两个解.如果两个叫都是实值,则模型的二次差分方程能分解成 (1 - uj 2 D ) 
的形式，这时 AR (2) 模型可以看成两个 AR (1) 模型的叠加，即一个 AR (1 ) 模型满 
足另一个 AR(1) 模型.因此，这时的 ACF 是两个指数衮减的混合.然而.如果 
的+ 40 2 < 0 .则 a 和 u ； 2 都是复数（称为复共轭对)，这时 q 的 ACF 将呈现出减 
幅的正弦和余弦波的图像.在商业和经济的应用中，复特征根很重要，它们会导致 
商业环的出现.对经济时间序列模型来说，复值特征根也很常见.对由 (2.12) 式定 
义的.带一对共轭复特征根的 AR (2) 模型.随机环的平均长度为 


cos - 1 [01 / ' 


其中反余弦函数的值以弧度表示.如果我们将复数解写成 a 土 6 i 的形式，其中 
i = 则我们有 = 2a , 02 = —( a 2 -f & 2 ),并且 

u 一 271 

cos -1 (a/ yjd 1 + b 2 )' 


其中 \ Jn 2 + b 2 是 a 土 6 i 的模. 

图 ‘2-4 显示的是四个平稳 AR (2) 模型的 ACF . ( b ) 图是 AR (2) 模型 （1 - 0.6 C 
+ 0.4 B 2 ) r t = 的 ACF . 因为的 + 40 2 = 0.36 + 4 x (-0.4) = -1.24 < 0,故这个 
AR (2) 模型包含两个复特征根，从而它的 ACF 呈现出减幅的正弦和余弦波状.其 
他三个 AR (2) 模型都是有实特征根的.它们的 ACF 呈指数衰减. 

例 2.1 作为说明，考虑美国的实际国民总产值 ( GNP ) 的季度增长率，我们已经 
作了季节调整.时间从1947年第二个季度到1991年第一个季度.图 2-5 给出了这 
个时间序列的时间图，并且该序列在第4章中将作为一个非线性经济时间序列的 
例子.这里我们简单地用 AR (3) 模型来分析这组数据.用表示增长率，我们可 
以用 2.4.2 节的建模方法来估计这个模型.拟合的模型是 

n = 0.004 7 + 0.35 rt _, - I - 0.18 r ,_ 2 - 0.14 r t _ 3 -f a t , a a = 0.009 8. (2.15) 

把上述模型改写成 


r t - - 0.18r*_ 2 + U.14rv_ 3 = 0.004 7 +a,, 





我们得到对应的三阶差分方程 
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1 一 0.35 B - 0.18 S 2 + 0.14 B 3 = 0, 


它可以分解成 


(1 + 0.525) (1 - 0.870 + 0.27 B 2 ) = 0. 

第一个因子 (1+0.52/?) 表明所考虑的 GNP 增长率有指数衰减的特征.对第二个 
因子 1 - 0 . 87 D - (-0.27) 5 2 = 0 ，有封 + 4扣= 0.87 2 + 4 (-0.27) = -0.323 1 < 0. 
因此.这个 AR (3) 模型的第二个因子说明美国的实际 GNP 的季度增长率中存在随 
机商 业环. 这一点是合理的，因为美国经济经历了膨胀和紧缩期.随机环的平均长 
度大约为 


k _ 2(3.14159) 

COS- 1 [01 / (2v/- 必 2)] 


= 10.83 (季度）， 


(a) 



(C) 




间隔 

((】） 


U- 

O 

< 


1.0 

0.5 

().0 

-0.5 


丁 

(3 


1 () 


15 


10 

间隔 间隔 

图 2-4 AR (2) 模型的自相关函数 ： （ a) 和 = 1.2, 扣 = 一 0.35; ( b ) 扣一 0.6, 
<h — —0.4; (c) (j>i — 0,2, 知一 0.35: (d) <f>i — —0.2, <f >2 = 0.35 


这大约为 3 年. 若用一个非线性模型去把美国经济分解成“膨胀期”和“紧缩期，， 
的话. 数据将表明紧缩期平均长度大约为3个季度，而膨胀期的平均长度为3年 
(见第4章中的分 析). 10.83 个季度是这两个平均长度的折中.这里得到的周期性 
在国民经济增长率的研究中是常见的，例如许多 OECD 国家也存在类似上面所述 
的现象. 
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1950 
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1970 
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198() 
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图 2-5 从〖947年笫二个季度到1991年第一个季度美国的实际国民总产值 
增11率的时间阁.数据按季节调整并以百分比 il 数 

平稳性 

AR (2) 时间序列的平稳性条件是它的两个特征根的模都小于 1. 在这个条件 
下.递推式 （2.13) 保证模型的自相关函数随 间隔/ 的增加而趋于 U . 这个趋于 （） 的 
性质是一个时间序列平稳的必要条件.事实上，这个条件也适用于 AR (1) 模型，这 
时特征多项式是1 - = 0,特扯根为 u：=\/x = < i > u 要使 n 是平稳的，必须有和 
的模小于 1. 而前面已证 明过. 对平稳 AR (1) 模型有灼=的，这隐含着当/ — oo 
时，有灼 一♦ 0. 

AR ( p ) 模型 

AR ⑴模型和 AR (2) 模型的结果可以推广到由 (2.9) 式定义的 AR ( p ) 模型.对 
平稳的 AR ( p ) 序列，其均值为 


E(r t ) 


<t>Q 


1 — ( t >\ — • 一 ( j)p ^ 


假定分母不等于 0. 模型对应的多项式方程为 

1 — ( t>\X — 02 X 2 _ — < f > p x p = 0, 

称之为该 AR { p ) 模型的特征方程.如果这个方程的所有解的模都大于1,则序列 
{ r t } 是平稳的.同样.解的倒数为该模型的特征根.因此，平稳性要求所有特征根的 
模都小于 1. 对于平稳 An ( p ；| 序列而吉，其自相关函数满足方程 

(1 — (j)\D — 02 打 2 — ... — 月 p ) pi = 0 , / > 0 . 



- I 

3 2 




自相关函数的图像呈现出减唱的止弦、余弦和指数袞减的混合状，具体形状取决十 
其特征根的性质. 
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2.4.2 实际中怎样识别 AR 模型 

在丈际应用中，一个 AR 序列的阶 P 是未知的，必须裉据实际数据来决定.求 
解阶 P 的问题叫做模型的定阶.在时间序列文献中这个问题己被广泛研究 
过.一般有两个决定的 方法： 第一种方法是利用偏相欠函数 (PACT. Partial Auto 
Corrflation Fimctioii); 第二种方法是用某个信息准则函数. 

偏自相关函教 

平稳时间序列的 PACF 是它的 ACF 的一个函数.它在给 AR 模型定阶时是一 
个有用的工具.一个简单而有效的引进 PACF 的方式是考虑如下一连串的 AR 模 
型： 

rt = < k).i + 0 i . ir £ _i 4- r u , 

Tt = 0n,? + (t>\/)Tt-A 4 - 4 - e<M ， 

rt = 00.3 4 - 01,30-1 + <A2.3T*f-2 + 03,3^-3 + ^3t, 

T't = 00,4 + 沴 1 , 40-1 + 02 , 4^-2 + 03 , 4^-3 + 04 , 4 ^ 4-4 4 - 


其中 .0 o , 』是常数项，是 r t _, 的系数， w 是 AR 0) 模型的误差项.这些模型都 
是多元线性回归的形式.可用最小二乘法来估计.事实上，由于它们是按阶的高低 
排列的，故我们可以应用多元线性回归分析中偏 F 检验的思想.第一个式子中的估 
计称为 r , 的间隔为1的样本偏自相关 函数; 第二个式子中的估计&, 2 称为 r t 
的间隔为2的样本偏自相关 函数： 第三个式子中的估计&. 3 称为 7 V 的间隔为3的 
样本偏自相关 函数： 依此类推. 

从定义可以看出，间隔为2的样本偏自相关函数&. 2 所表示的 是：在 AR (1) 
模型 r , = </> n + 0 ir^_i + ei , 基础上添加的 n _ 2 对 r , 的贡献:表示的是在 AR ⑵ 
模型上添加的 n - 3 对的 n 贡献; 如此等等.因此，对一个 AR ( p ) 模型，间隔为 P 的 
样本偏自相关函数不应为零，而对所有 j > P ， 应接近于零.我们利用这一性质 
来决定阶对于平稳高斯 AR ( p ) 模型，可以证明其样本偏自相关函数 （ PACF ) 有 
如下 性质： 

• 当样本容量 r 趋于无穷时， ‘, p 收敛于 0 P; 

• 对 t > p , 沴 i , i 收敛丁•零； 

• 对 f > p , 士,£的渐近方差为 

这些结果表明， AR ( p ) 序列的样本偏自相关函数是 p 步截尾的. 

作为例子，考虑从1926年1月到1997年12月的 CRSP 价值加权指数月简单 
收益率.表 2-1 给出了这个序列的样本自相关函数在前10个间隔上的值. r =864, 
该样本偏自相关函数的渐近标准差大约为 0.03. 从而，在5%的显著水平下，我们 
给数据识别一个 AR (3) 模型或 AR (5) 模型（也就是 p =3 或 5). 
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表 2~1 

从 1926 年 1 月到 1997 年 12 月的 CRSP 价值加权指数月 
简单收益率的样本 PACF 和 AIC 

P 

1 

2 

3 

4 

5 

PACF 

0.11 

-0.02 

-0.12 

0.04 

0.07 

AIC 

-5.807 

-5.805 

-5.817 

-5.816 

-5.819 

P 

6 

7 

H 

9 


PACF 

-0.06 

0.02 

0.06 

0.06 

-0.01 

AIC 

-5.821 

-5.819 

一 5.820 

一 5.821 



作为另外一个例子，图 2-6 给出了例 2.1 中 GNP 增长率的 PACF . 图中的虚线 
表示的是大约为两个标准误差的上下限土 (2/ n / T 元).此图表明 AR (3) 模型适合该 
数据，因为样本 PACF 在前三个间隔点上比较大. 



图 2-6 从1947年第2季度到 19 ( J 1 年第1季度的美国实际 GNP 季度增 氐率的 
样本偏自相关系数.虚线给出了 S 信水平为95%的贾信区间的近似 
信息准则 

有几种信息准则可用来决定 AR 过程的阶 p , 它们都墓于似然函数.例如，著 
名的 Akaikc 信息准则 ( AIC )( Akaike , 1973) 定义 如下： 

AJC =^ In (似然函数的最大值)+ | (参数的个数)， (2.16) 

其中 T 是样本容量.对高斯 AR ( l ) 模型， AIC 简化为 

AIC ( l ) = ln ( af ) -f 

其中矸是4的最大似然估计，4是的方差， r 是样本容量（见 （1.18) 式). 
(2.16) 式中的 AIC 的第一项度量的是 AR ( l ) 模型对数据的拟合优度，而第二项称 
为准则中的惩罚凼数， 因为它 用参数的个数来惩罚所用的模型.不同的惩罚函数导 
致了不同的信息准则. 
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另外一个常用的信息准则函数为 ( Schwarz ) 贝叶斯信息准则 ( RIC ). 对高斯 
AR {1) 模型，该准则为 

BIC ⑷ = In ( 〜 2 ) + ^^. 

对每个参数的惩罚在 AIC 中为2,而在 BIC 中为 ln ( T ). 因此.当样本容量适度或 
较大时， BIC 倾向于选择一个低阶的 AR 模型. 

选择规则 

在实际应用中，为了利用 A 1 C 米选择一个 AR 模型，要计算 AIC (/)， 对/=0,1, 
2，. . P ， 其中 P 为事先给定的一个止整数，然后选择阶 A :， 使 AIC 达最小值. 

表 2-1 也给出了 p = l ,2, …，10时 AIC 的值.这些 A 1 C 的值都很靠近，当 p = 
和 p = 9时达最小值 -5.821, 故按准则应选 AR (6) 模型.这个例子说明不同的方 
法可能会得出阶 p 的不同选择.在实际应用中，还没有证据表明一种方法就一定比 
另外一种方法好.对给定的时间序列数据选择一个 AR 模型时,还有两种因素起着 
重要作用，即所研究问题的具体信息和模型的简单性. 

再次考虑例 2.1 中美国季度实际 GNP 增长率序列. S - Plus 中 Finmetrics 模块 
给出的 A 1 C 识别了一个 AR (3) 模犁.这里，准则信已经经过调整以使得 AIC 的最 
小值为 0. 

> gnp=scan{file= , q-gnp4791.txt*) 

> ord=ar(gnp) 

> ord$aic 

[1] 27.569 2.608 1.590 0.000 0.273 2.203 

[7 】 4.017 5.992 5.826 7.523 7.822 9.581 

[13] 7.398 8.943 10.912 12.895 14.298 16.279 

[19] 18.100 20.050 22.007 23.436 25.378 

> ord$order 
tl] 3 

参数估计 

对 f 由 (2.9) 式给出的一个具体的 AR ( p ) 模型，我们常用条件最小二乘法来估 
计其参数.条件最小二乘是从第 p 十1个观测值开始的.具体地说，在给定前 p 个观 
测值的前提下，我们有 

= 00 + < Pi r t-i H - + <l>p r t-p + o ， t , t = p + 1， • •. , T, 

上式为多元线性回归的形式,其中的参数可用最小二乘法估计. 记土为 0,的估计, 
所拟合的模型为 

rt = 00 + 0 ir/_i -+ 0 p r t _ p 


对应的残差为 


a t = r t — f t . 
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称 {a t } 为残差序列，并得到 

-2 _ [Lp+1 好 
a 一 T - 2p — 1 • 

如果用条件最大似然方法，么的估计保持不变，而4的估计变为 ol = alx { T - 
办- \)/(T-p). 作为说明.考虑给表 2 -1 所示的价值加权指数的月简单收益率建立 
一个 AR(3) 模型，所拟合的模型为 

rt = 0.010 3 I 0.104^，! - 0.010r t _ 2 - 0.120r 4 一 3 十 a t ， a a = 0.054. 

系数的标准误差依次分别是 （u )() 2, n.n34. n.o:w 和 n.034. 除了延迟为2的系数外， 
其他参数在的水平下都是显著的. 

对这个例子，所建 AR 模型的系数都很小，表明所考虑序列的序列相关性较弱， 
即使这种相关性在1%水平下是统计显 著的. 所拟合的模型中&的显著性意味着 
这个序列的期望平均收益率是正的.事实上， /x=0.010 3/(1-0.104+0.010+0.120)=0.01. 
是一个很小的正数，但它有重要的长期意义.这意味着所考虑的指数的长期收益率 
是相当大的.利用第1章中定义的多周期简单收益率，这时平均年度简单毛收益韦 
是 1111^1(1 + )1 12/864 - 1 « 0.105 3. 换句话说，从 19邡年到 1997年 CRSP 价 

值加权指数的月收益大约平均每年增长10.53%.此数据支持这样一个 观点： 长期 
来看，股票巾场的表现令人乐观•在 192 6 年初1美元的投资，到1997年底的价值 
大约1350美元. 

模型的检验 

我们必须仔细地检査所拟合的模型以防止可能存在的模型的非充分性.如果 
模型是充分的，则其残差序列应是白噪声.残差的样本自相关函数和 （2.3) 式定 
义的 Ljung-Box 统计量可用米检验与一个白噪声的接近程度•对 AR(p) 模型， 
Ljung-Box 统 i| 量 Q(m) 渐近服从自由度为 m - 的分布，其中 g 是所用模型 
中 AR 系数的个数.这里对自由度进行了修止，是因为从拟合 AR(0) 模型到拟合 
AK( P ) 模型，对残差心的限制个数增加了.如果所拟合的模型经验证是不充分的， 
那么就需要对它进仃重新改进.例如，如果某些被估 AR 系数与0没有显著差别， 

则我们应该去掉这些不显著的参数，以此对模型进行简化.如果残差显示出额外的 
序列相关性，则应考虑到这些相关系数而对模型进行扩展. 

现在考虑对价值加权指数的月简单收益率拟合 AR(3) 模型所得的残差序列. 
可算得 Q(12)=16.9, 并且基于自由度为9的 x 2 分布的 p 值为 0.05. 这样.在5% 

的水平下，前12个间隔无序列相关性的原假设几乎不能拒绝.然而，延迟为2的 
AR 系数在5%的水平下是不显著的.我们可以将模型改进为 


77 = 0.010 2 十 t ).103 rf 一 1 — 0.1227^— 3 + < r tt = 0.054 2, 
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0 

1 

2 

3 


NONE 

.0103 

.0019 

5.34 

NONE 

.1041 

.0338 

3.08 

NONE 

-.0103 

.0340 

-.30 

NONE 

-.1204 

.0338 

-3.56 


EFFECTIVE NUMBER OF OBSERVATIONS . . 861 

R-SQUARE. 0.025 

RESIDUAL STANDARD ERROR. 0.541903E-01 

acf rl. maxi 12. 

NAME OF THE SERIES. Rl 

TIME PERIOD ANALYZED.4 TO 864 

MEAN OF THE (DIFFERENCED) SERIES • • • 0.0000 

STANDARD DEVIATION OF THE SERIES . . • 0,0542 

T-VALUE OF MEAN (AGAINST ZERO) • • • • 0.0000 


AUTOCORRELATIONS 

1- 12 .01 .01 ••01 .03 .09 .01 .04 .08 - .00 -.03 .01 

ST.E. .03 .03 ,03 .03 .03 .03 .03 • 03 .03 .03 .03 .03 

Q .0 .1 .2 1.0 7.4 9.3 9.3 10.6 15.8 15.8 16.8 16.9 

p*l-cdfc(16.9,9) % Compute p value. 

print p 


其中所有的估计在5%的水平下都是显著的残差序列给出 Q (12)=17 2, 其值为 
0.070( 基子分布).该模型对数据的动态线性依赖性的建模是充分的. 

SCA 演示 

给出了输出结果. 

input vw. file # m-vw2697.txt 1 

tsm ml . model (1,2,3) vw=c-»-noise. % Model specification 
estim ml. hold resi(rl). 

SUMMARY FOR UNIVARIATE TIME SERIES MODEL Ml 

VARIABLE TYPE OF ORIGINAL DIFFERENCING 

VARIABLE OR CENTERED 

VW RANDOM ORIGINAL NONE 

PAR. VAR. NUM./ FACTOR ORDER CONS- VALUE STD T 

LABEL NAME DENOM. TRAINT ERROR VALUE 


CNSgARAR 

vwvwvw 
c 

12 3 4 


.050 
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S-Plus 演示 

给出了输出结果. > 表示 DOS 提示符. 

> vw^scan ( f ile= # m-vw2697 . txt # ) 

> ar3=0LS (vw-ar (3)) 

> summary (ar3) 

Call: 

0LS(formula = vw - ar (3)) 

Residuals : 

Min IQ Median 3Q Max 

-0.2845 -0.0259 0.0025 0.0288 0.3705 


Coefficients : 


(Intercept) 

lagl 

lag2 

lag3 


Value SLd. Error 
0.0103 0.0019 

0.1041 0.0339 

-0.0103 0.0341 

-0.1204 0.0339 


t value Pr(>ItI) 
5.3314 0.0000 

3.0716 0.0022 

-0.3016 0.7630 

3.5538 0.0004 


Regression Diagnostics : 


R-Squared 0.0258 
Adjusted R-Squared 0.0224 
uurbin-Watson Stat 1.9890 


> autocorTest(ar3$residuals,lag=12) 


Test for Autocorrelation : Ljung-Box 
Null Hypothesis : no autocorrelation 
Statistics : 

Test Stat 16.9367 

p.value 0.1520 % 3-Plus uses 12 degrees of freedom. 

> 1-pchisq(16.9367,9) % Calculate p-value using 9 df• 

[丄】 0-04971652 


2.4.3 拟合优度 

衡最平稳模型拟合优度的一个常用的统计量是 i ? 2 统计量.其定义为 

„2 _ 1 残差的平方和 
总的平 方和’ 

对于平稳 AR ( p ) 模型，假设有7’ 个观测 { r t |/ = 1， … ， T }， 则炉变为 





T . I - P + i(n - r ) 2 
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其中 r = f ^ / [ T - p ). 容易证明，0 ^ R 2 ^ L 特别地， H 2 越人，表示模型 

\*=r+i ) 

对数据拟合地越好，然而该结论只对平稳时间序列成立.对于本章后面将要讨论的 
单位根非平稳序列，当样本容量趋于无穷时，无论 n 实际服从一个怎样的模型，对 
其拟合一个 AR (1) 模型时，7? 2 均趋于 1. 

众所周知，对于一个给定的数据集.舻是所用参数个数的非降函数.为了克服 
该缺点，建议用调整后的/? 2 ,它定义为 


%J . n2 ,残差的方差 

=1-竺 

by 

其中 g 是 n 的样本方差.这个新的衡量方法将拟合模型中用到的参数个数也考 
虑在内.然而，其取值仍然在0和1之间. 


2.4.4 预测 


预测是时间序列分析中的一个重要段用.对 (2.9) 式中的 AR ( p ) 序列，假定我 
们在时间指标为 A 的点上，欲预测 I ^1. 时间指标 A 称为预测原点 （forecast 
origin ), 正整数/称为预测步长 （forecast horizon ) •设心⑴为的最小均方误 
差预测， F h 为在预测原点所得到的信息集合.则我们选择 f k ( l ) 作为预测.使得 
f k ( l ) 满足 

E {[ r*. M - r h { l .)] 2 \ F h } ^ min E [{ r h+ i - ff ) 2 | F / t ], 

9 


其中 g 是"时刻（包括//时刻）所得到的信息的函数，即 y 是 A 的函数.我们称 
f h [ i ) 为 n 的以/ I 为预测原点的向前/步预测. 


向前1步预测 


由 AR ( p ) 模型.我们有 


rft+i = 炎 0 + + …+ 0p'O»+i-p + a/i+i- 

在均方损失函数下，给定 A - 卜 r h _!, r h+1 的点预测为条件期望 

P 

^h(l) = •E(r h+1 |F/ I ) = 0u H- <f>jrh+L-i, 

i=l 

对应的预测误差为 

e / t ( l ) = r/, + j - fh ( l ) = ah + i - 

从而，向前 1 步预测误差的方差为 Var [ e h ( l )] = 4.若服从正态分 

布 ，则 r h+1 的 95% 的向前 1 步区间预测是 4 ⑴士 1.96 x a a . 对 (2.4) 式给出的 
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线性模 型，〜 +1 也是以/为预测原点的向前1步预测误差.在计量经济的文献中， 
称为 〖 f 1时刻序列的扰动. 

在实际应用中，经常用被估参数来计算点预测和区间预测.这导致了条件预测. 
因为这样的预测没有考虑参数估计中的不确定性.理论上，我们可以在预测中考虑 
参数的不确定性，但其复杂性将大大增加.当在估计中使用的样本容量充分大时, 
条件预测与无条件预测是接近的. 

向前2步预測 

下面考虑以/ I 为预测原点刘 r h +2 的预测.由 AH ( p ) 模型，我们有 

r h^-2 = 也 0 + 01 ^4 1 + • • • + 小 p『h 十 2- p + a/ 叶 2. 

取条件期望，我们有 

4(2) = E(rh 十 2| 八 ） — 00 + 0i ^7i(l) + 02^/i 十 . • • + 0 p r"+2 - p 

对应的预测误差为 

e h(2) = r"+2 — ^(2) = 01 [rh+i — 〜⑴]+ 叫 +2 = ^h+2 + 0ia"+i. 

预测误差的方差为 Var [ e / ,(2)] = (1 + r/i+2 的区间预测可以用与相同 

的方法计算出来.值得注意的是 Var [ e ft (2)] ^ Var [ e / t ( l )], 这意味着预测步长的增加 
佥使预测中的不确定性也增加.这与通常的感觉是一 致的： 对线性序列来说.我们 
在 / i 时刻对 r h + 2 的把握不如对 r / l +1 的把握大. 

向前多步预測 
一般地，我们有 

= 00 + + • • • + 必 pM+'-p + 

基于均方损失函数最小化而得到的向前/步预测就是给 定/^ 的条件下的条 
件期頊，可以由下式得到 

p 

—h 十 a — (f>o + ^ <Pirh{i *)» 

<=i 

其中，当 i <0 时，约定 r h { i ) = r h + t . 这个预测可用 r „(0, i = 1，2,…，卜1递推计算 
出来.向前/步预测的误差是 e „( Z ) - r 叫- f h ( l ). 可以 证明： 对平稳 AR ( p ) 序列， 
当 / — + oc 时， r ,,( Z ) 收敛于 E ( r ,). 也就是说，对这样的 序列. 长期的点预测趋于 
无条件均值.在金融文献中，这种性质称为均值回转 （meaii reversion ). AR (1) 模型， 
均值回转的速度由半衰期 ( linlf - life ) 来衡量，其中半衰期定义为 A ： = hHU . S / AI ). 预 
测误差的方差则趋于 7 V 的无条件方差. 
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表 2-2 包含了对价值加权指数月简单收益率的向前1步至6步的预测结果和 
相应的预测误差的标准差：以 858 为预测原点，利用前 858 个观察值重新估计的 
AR(3) 模型.实际的收益率也已给出.由于序列的弱自相关性，预测值和预测误差 
的标准差将很快收敛到样本均值和数据的标准差.前858个观察值的样木均值和 
标准差分別为 0.009 8 和 0.055 0. 

表 2~2 对 CRSP 价值加权指数月简单收益率用 AR (3) 模型的 


向前多步预测的结果，预测原点为 858 


步数 

1 

2 

3 

4 

5 

6 

预测值 

0.008 8 

D.002 0 

0.005 0 

0.009 7 

0.010 9 

0.010 6 

标准误恙 

0.054 2 

0.054 6 

0.054 6 

0.055 0 

0.055 0 

0.055 0 

实旰值 

0.076 2 

-0.036 5 

0.058 0 

-0.034 1 

0.031 1 

().018 3 


图 2-7 所示的是对价值加权指数月对数收益率的超出样本范围之外的向前1 
步至6步的预测值和它们的两个标准差的上下限.这些预测是由下述 AR (5) 模型 
给 出的： 

r t = 0.007 5 + 0.103 r ( _! +- 0.002 r t _ 2 - 0.114 r t _3 十 ().032 r «_ 4 + 0.084 r t _ 5 + a t , 

其中心 = 0.054, 该模型是由前面所讨论的建模程序建立的.在这个例于中，预测 
值很接近实陈值.所有实陆值都在95%的预测区 W 内. 



图 2-7 CRSP 价值加权指数月对数收益丰.的向前 I 步至步的预测图预测原点为 （=858, 
预测值用空心点“。”表示，实际值用实点“”表示.两条虚线表示预测值的两个标 
准误差的上下限 


2.5 简单滑动平均模型 


本节将讨论另-类简单模型.它们在金融收益率建模中也很有用.这类模型叫 
做滑动平均模型 (moving-average, MA). 引进 MA 模型有几种方式：一种方式是把 
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它当作白噪声序列的简单 推广； 另一种方式是把它看成参数受某种限制的无穷阶 
AR 模型.本节采用第二种方式.如在第5章将要讨论的，在股票交易中.买卖价格 
间的跳动会在收益率序列中引出一个 MA (1) 结构. 

除/简单性之外，没有特别的理由假定 AR 模型的阶是有限的.我们可以考虑 
(至少在理论上）无穷阶 AR 模型为 

r t = 00 + 沴 in—l + 2 + ••• + 〜• 

然而，这样的 AH 模型是没有实际意义的，因为它有无穷多个 参数. 使这样的模型 
有实际用途的一个方式里假定系数办满足某种限制，使得它们可由有限个参数决 
定.这种想法的-个特殊情形为 

r / = 00 - - 2 - d ] r t 3 -+ a ,, (2.17) 

其中系数只依赖于单个参 数化， 么= 一巧， i 彡：!•要使 (2.17) 中的模型是平稳的，化 
必须是绝对值小于丨的， 否则巧 和序列本身将发散.因为|心| < 1，故当 — oo 时， 
有 M — 0. 从而 tv , 对的贡献随 i 的增加以指数速度衰减.这一点是合理的, 
因为 、 F 稳序列^对它的延迟值 r t _ t 如果有依赖的话.这种依赖程度应随时间衰减. 
(2.17) 中的模型能写成一个相当紧凑的形式.为此.我们把模型先写成 

r t + 0\ r t -i + 0 \ r t -2 + … =0() + a t . (2.18) 

对 r t 1 的模型为 

r t-l +〜 n .-2 + ^ fn ~3 + … =00 + a ,- i . (2.19) 

在 (2.19) 式两边 乘以心 t 然后减去 (2.18) 式，得到 

r t = 0 o(l - 6> i ) + at - 

此式说明：除去常数项外， r t 是两个扰动 a , 和 an 的加权平均.因此，此模型称 
为1阶 MA 模型，简称为 MA ⑴ 模型. MA (1) 模型的一般形式为 

n = cq + 叫 一 或 n = co + (1 — 0\ D ) at , (2.20) 

其中 c n 是一个常数， { a ,} 是一个白噪声序列.类似地. MA (2) 模型的形式为 

rt = Cq O x a t -i - 0 2 a t - 2 , (2.21) 

MA (7) 模型为 

rt = co 十 u t _ 卜 ！ - d q a t — q 、 (2.22) 

或 r ，. = cq — 6 \D — ••• — 0 q B q ) at , 其中 c |>0. 
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2.5.1 MA 模型的性质 

我们仍然只讨论简申的 N 1 A (1) 和 MA (2) 模型. MA ( y ) 模型的结果可用相同 
的方法得到. 


平稳性 

MA 模型总是弱平稳的.因为它们是白噪声序列的有限线性组合，其前两阶矩是不 
随时间变化的.例如.考虑 (2.20) 式给出的 MA (1) 模型.对这个模型两端取期望可 
得 E { n ) = 这不随时间变化.在 (2.20) 式两端取方差，我们有 

Var ( r t ) = aj + d\al = (1 + d 2 { ) al ， 

这里我们用到与〜的不相 关性. Var ( r f ) 也不随时间变化.这些讨论对一般 
的 MA ⑷模型也适用.因此我们得到两个一般性质：第一， MA 模型的常数项就是 
序列的均值[也即 E ( r t ) = co ]; 第二， MA ⑷模型的方差为 

Var(n) = (l+ 的+硿 +…+%)4. 


自相关函数 

为简单起见.假定 MA (1) 模型中 co = 0. 对两端乘以 r ( _,, 我们有 

n-iTt = r t -ta t - 


驭期望.得到 

71 = —^ l <7 a ， 且^ > 1 时，7/ = 0 
利用上述结果.并注意到 Var ( r ,) = (1 + 0? K ， 我们有 


/ >o = I, Pi 


—0 i 

TTW ， 


pi — o , 


其中/> i . 


因此，对 MA (1) 模型，间隔为1的 ACF 不为0,但所有间隔大于 i 的 ACF 都是 ( J . 
换言之， MA (1) 模型的 ACF 在间隔为1以后是截尾的.对 (2.21) 式给出的 MA (2) 
模型.自相关系数是 


- 0 \ 4- 0\02 一汐2 

= TTefTM' P2 = 1 + 0 ? + 的 ’ 


pi = 0,其中 / > 2. 


这时，在间隔为2以后截 M . 这个性质可推广到其他 MA 模型.对 MA ⑷模型，其 
ACF 在阆 隔为 q 时不为 （)， 但对/ > 士内= (). 因此， MA ⑷序列只与其前个延 
迟值线性相关，从而它是一个“有限记忆”的 模型. 
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可逆性 

将零均倌 MA(1) 模型改写为 a t =r t +O ia ^ u 重复迭代可以得到 
a « = n + O x r t -\ 4- 6 2 x r t -2 + + … . 

该等式表明当前的扰动 a, 是现在和过去收益率序列的线性 组合. 从直观上看，随 
着的增加朽应该趋于零，因为遥远的过去收益率对当前的扰动应该几乎没有影 
响.因此，要使 MA(1) 模型看起来是合理的，我们应该要求此| < 1. 这样的 MA(1) 
模型称为可逆的■如果的 | = 1•则 MA(1) 模型是不可逆的.对于可逆性的进一步 
讨论可参见本书2.(5.5节. 

2.5.2 识别 MA 的阶 

自相关函数是识别一个 MA 模型的阶的有用工具.如果时间序列 q 具有自相 
关函 数付， 若外一 0,但对 f > <?有内= 0,则服从一个 MA ( g ) 模型. 

图 2-8 所示的是 CRSP 等权重指数 ( equal-weighted index ) 从1926年1月 
到1997年12月的月简单收益率的时间图和样本自相关函数图在样本自相关函 
数阁中有两条虚线，它们是两个标准误差的卜、下限可见，该序列的自相关系数在 
间隔为1, 3. 9时 显著. 对更大的间隔也有稍显著的.但在这里我们不作考虑.基于 
样本自相关 函数. 我们给该序列建立下面的 MA(9) 模型： 

T't ~ Cq at — - 1 — 6^(1(^ — Ogat^g. 

注意到，与样本 PACF 不同，样本 ACF 提供了模型非零 MA 延迟项的信息. 



M 隔 

图 2 -H CRSP 等权重指数从 192( i 年1月到1997年12月的月简单收益率的 
时 W 图和样本自相关函数图 
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2.5.3 估计 

估计 MA 模型通常用最大似然法.有两种方法求 \1 A 模型的似然函数.第 
—种方法是假设初始的“扰动”(即 a t , t < 0) 都是0,这样由 q = r ! - Co , « 2 = 

r 2 -co 4- 9 x a x . 可递推得到计算似然函数所需要的“扰动”.这种方法称为条件 

似然法.所得的估计是条件最大似然估计.第二种方法是把初始“扰动” （< < 0) 
当作模型的附加参数与其他参数一起估计出来，这种方法称为精确似然法.精确似 
然估计优于条件似然估计，尤其是当 MA 模型接近于不可逆时.然而，精确似然估 
i 十的计算会更 复杂些 . 如果样本量较大，这两种似然估计是接近的.关于 MA 模 
型精确似然估 U 和条件似然估汁的有关细节方面的讨论，读者可参阅 Box ， Jenkiu « 
和 Reinsel (1994) 的书或本书笫8章. 

作为例子.我们来考虑 CRSP 等权重指数的月简单收益率序列，建立一个 MA (9) 
模型.用条件最大似然法拟合的模型为 

r t = 0.013 + f Q .181 a t _i - 0.121 a t _ 3 + 0.122 a f _ 9 , ( r a = 0.072 4, (2.23) 

其中系数估计的标准误差分别为 0.003 0.0.032,0.032 和 0.032. 残差的 Ljung-Box 
统计量为 Q (12) = 15.0, 基于自由度为9的 x 2 分布的 P 值为 0.091. 看起来.模型 
对于数据线性动态依赖关系的刻画是充分的.用精确最大似然法拟合的模型为 

r t = 0.013 + a t + 0.183 a ( _i - 0.120 a t _ 3 + 0.123 a f _ 9 , b a = 0.072 4, (2.24) 

其中各估计的标准误差为（].()03, ().032,0.032 和 0.032. 残差的 Ljung - Box 统计量为 
Q(12) = 10.2, p 值为 0.08G. 所拟合的模型也是充分的.比较 （ 2.23) 和 (2.24), 可见. 
对这样个具体例了来说，条件似然法和精确似然法的差别是可以忽略的. 

2.5.4 用 MA 模型预测 

MA 模型的预测很容易做因为模型具有有限记忆性，它的点预测就会很快达 
到序列的均值.为了说明这 一点： 设预测原点为 h 尬 h 时刻所能得到的信息 
集合.对 MA (1) 过程的向前一步预测，由模型知 

= Co + a/i+i — 

取条件期望我们有 

rh (1) = E ( r/ l+ i \ Fh ) =Co — 0 ia h . 

eh (1) = r/i+i — ft, (1) = ah+i- 

向前一步预测误差的方差为 Var [ e / l ( l )]=^. 在实际中 ，叫 这个量可由几个方式得 
到，例如可假定 tt 0 = 0,则有 a ! = ri - c * o , M a t , 2 s ； t ^ /i 可由 = r t —+ 

递推得到.另外，还可用 MA ⑴ 模型的 AR 表示 来计算(参见 2.6.5 节). 
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关于向前两步预测，由方程 

厂 " 十 2 = + a U+2 ~ ^1 a/i 十 1 ， 

我们有 

fh (2) = E (r h+ '2 |F/,) =co, 
e/» (2) = rh+2 - fh (2) = ah+y. - 0'ah+u 

预测误差的方差为 Varf , / l (2)] = (1 I 91) 这是模型的方差，它大子或等丁-向前 

一步预测误差的方差.上面的结果表明 MA (1) 的向前两步预测即是模型的无条件 
均值，这一点对任意预测原点都 正确. -般地 . f 〃⑷= co , / $ 2. 总而言之，刘一 
个 MA (1) 模型，以 A 为预测原点的向前一步预测为 c 0 -^ a h , 向前多步预测为模 
型的无条件均值 co. 如果我们画出 f h ( I ) /变化的图像.会看到从一步以后预测 

值成一个水平 直线.因此. 对于 MA (1) 模型而自.均值回转只需要一个时间周期. 
类似地.对 MA (2) 模型，我们南 

r/t-M = + a/»4-/ — 1 - ❹ 2(i.h \ l -2, 

由此得到 

h (1) =co - OiUh - O ^ ah - 1 , 

子 h (2) = Co - 02 dh , 
fh (/) = Co , / > 2. 

这样， MA (2) 模型的向前两步以后的预测即达到序列的均值.两步以后预测误差的 
力差也是序列的 方差. 一般地.对一个 \ lA ( r /) 模型，向前 7 步以后的预测就达到了 
模型的均值. 

表 2-3 给出的是 (2.23) 式中对等权重指数的月简单收益率建立的 MA (9) 的一 
些预测值.预测原点为 h = 926(2003 年2月) • 序列的前 92 G 个观察值的样本均值 
和样本标准差分别是 0.012 6 和 0.075 1. 正如所料，该表说明： （ a ) 向前10步预测 
值即为样本 均值； （ b ) 当预测步数增加时预测误差的标准差趋于序列的标准差. 

_表 2 _ 3 CRSF 等权重指数月简单收益军拟合 MA (9) 模型时的预测表现" 


步数 


预猁值 

0.U14 U 

-0.005 (J 

0.015 8 

-0.000 8 

0.017 1 


0.072 6 

0.073 7 

0.073 7 

0.074 3 

0.074 3 

实际值 

0.009 7 

0.098 3 

0.133 0 

0.049 G 

0.061 7 


m 测值 
鉍准差 
实际值 


0.025 7 
0.074 3 
0.047 5 


0.000 9 
0.071 3 
0.025 2 


0.014 9 
0.074 3 
0.081 0 


0.009 9 
0.074 3 
0.038 1 


10 

0-012 6 
0.074 8 
0.039 1 


预测原点为 A — 926,即 2( X )3 年2 11,模甩的估计是用条件最人似然法得到的. 
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小结 

我们对 AR 和 MA 模型进 行一个简短的总结.木节讨论了以下一些 性质： 

•对 MA 模型， ACF ( G 相关函数）是定阶的有力工具.因为对 MA ( g ) 序列 ， ACF 
是步截 尾的； 

•对 AR 模型， PACF (偏自相关函数）是定阶的有力工具，因为对 AR ( p ) 过程， 
PACF 是 p 步截 尾的； 

• MA 序列总是平稳的，而对 AR 序列，当其特征根的模都小丁 • 1时，它是平稳 
的； 

• 对一个平稳序列，向前多步预测收敛到序列的均值，预测误差的方差收敛于序 
列的方差. 


2.6 简单的 ARMA 模型 

在有些应用中，我们需要高阶的 AR 或 MA 模型才能充分地描述数据的动态 
结构.这样就有很多参数要估计，问题变得繁琐了.为了克服这个困难.人们提出了 
自回归滑动平均 （ ARMA) 模型.参见 Box, Jenkins 和 Reinsci(1994). 基本思想是 
把 AR 和 MA 模型的想法结合在一个紧凑的形式中，使所用参数的个数保持很小. 
对金融中的收益率序列，直接用 ARMA 模型的机会较少.然而， ARMA 模型的概 
念与波动率建模有密切关系.事实上.广义自回归条件异方差 (GARCH) 模型就可 
以认为是对 {a.” 的 ARMA 模型.尽管是非标准的.第3章中会详细讨论这一点. 
本节将研究最简单的 ARMA(1,1) 模型. 

称一个时间序列 n 服从 ARMA(1,1) 模型.如果 rv 满足 

r< - <t>\r t -\ =(f>o-\-a t - d\a t -i, (2.25) 

其中 {a,} 是白噪声序列. (2.25) 式的左边是模型的 AR 部分，右边是 MA 部分.常 
数项为 00. 为使这样一个模型有意义，要求否则，在方程的两端消去一个 
公因,方程所决定的过程就变为了一个白噪声序列. 

2.6.1 ARMA (1, 1) 模型的性质 

ARMA ( M ) 模型的性质是 AR (1) 模型的相应性质的推广，只是作些小的修 
改米处理 MA (1) 部分的影响.首先讨论 T 稳性条件.在 (2.25) 式两端取期望，得到 

E(ri) - <fnE(r t 一 1) = d>u + E(a t ) —OiE (a.,_x). 

因为对所有的 i , 都有 E ( ai ) = 0,所以只要序列是弱平稳的，则的均值为 


4>o 


K(n) = fJ- = 


l-^i 
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此结果和 （2.8) 式 AR (1) 模型的结果完全一样. 

为简单起见.假定如= 0. 下面我们考虑 r , 的_协方差函数首先，在槙继两 
端乘以再取期望，我们有 


E ( r , tt <) = E ( af ) - (JiE ( a ， ia t - i ) = E ( af ) = aj , 


(2.2 Ci ) 


把模型改写成 


n = 0 m_j - j - a t - 6> ia t _ i , 


在上式两端取方差.得到 


Var ( r t ) = 0? Var ( r , - i )- ha ^+ 0^ - 2< t > ie l E { r l ^ l a l ^ l ) 
这里用到与 a , 不相关这一事实.利用等式 (2.26), 我们得到 

Var ( r t ) - ^ Var ( r t _!) = (l -2010, 

从而，若序列 n . 是弱平稳的.则 Var ( n ) = Var 且 


Var ( r t ) 


1-0? 


闵为方差是正的，故要求 # < 1( 也即 1 < 1). 这又弓 AR (1) 模型的平稳性条件 
—样了. 

为了得到 r t 的自协方差函数，我们 假定如 = 0,并在 (2.25) 式两端乘以 r t _ i ， 

得到 

nn-i - (Pin-m-i = utn-i - 6j_a t —ir t —i. 

对/ = 1，在上式两端取期望并利用 / - 1 时的 （2.26) 式，我们有 

7i - 01 7o = -fhcrl ， 

其中7< = Cov { r t , r t /). 这个结果不同子 AR (1) 情形，对 AR ⑴模型有 71 0，7 u = 
0 . 然而，对/ = 2 . 取期望后得到 

72 - </>i7i = 0, 


这与 AR ⑴情 形样. 事实上用相同的方法可得到 

H - 0i7/- 1 = 0, / > 1. 

对于 ACF , 上述结果 表明： 对平稳 ARMA (1,1) 模型，有 


(2.27) 


Pi = <Pi 




， pi = 4>ipi-i, I > 1 . 



2.G 简单的 AR.MA 模型 




这样. ARMA ( Ll ) 模型的 ACF 很像 AR ⑴模型的 ACF , 不同之处仅在于它的指 
数衰减是从间隔2开始的.因此. ARMA ( l . l ) 模型的 ACF 不能在任意有限间隔后 
截尾. 

现在来看偏自相关函数 ( PACF ). 可以 证明： ARMA (1,1) 模型的 PACF 也不能 
在有限间隔后截尾.它与 MA (1) 模型的 PACF 表现很相似，只是指数衰减从间隔 
2开始，而不是从间隔1开始 

综上所述， ARMA(1 ， 1) 模型的平稳性条件与 AR(1) 模型的相同， ARMA(1,1) 
模型的 ACF 与 AR(1) 模型的 ACF 形式相似，只是这种形式从间隔 2 处开始. 

2.6.2 一般的 ARMA 模型 

—般的 ARMA ( p , q ) 模型的形式为 

V Q 

r t = 00 + 〉: i + a t ~ 

i=l i=l 

其中是白噪声序列. p 和</都是非负整数. AR 和 MA 模型是 ARMA ( P ， v ) 的 
特殊情形.利用向后推移算子，上述模型可写成 

(1 - <t>iB - <f> v B^) = - O q B q )at. (2.28) 

模型的 AR 多项式是1 ( f^B …知1^， MA 多项式是1 — - OqW . 

我们要求 AR 多项式和 MA 多项式没有公因子，否则模型的阶 （ p ， 会降低.如 
AR 模型一样， AR 多项式引进了 ARMA 模型的特征方程.如果特征方程所有 
根的绝对值都小于 1 ， 则该 ARMA 模型是弱平 稳的. 这时，模型的无条件均值为 
E (rt) = 0o/ (l — ^i -- 0 P ). 

2.6.3 识别 ARMA 模型 

在给 ARMA 模型定阶时. ACF 和 PACF 都不是很有用的. Tsay 和 Tiao(1984) 
提出一个新方法,利用推广的自相关函数 ( EACF ) 来确定 ARMA 过程的阶. EACF 
的基本思想相当简单.如果我们能得到 ARMA 模型的 AR 部分的相合估计，则能 
导山 MA 部分. 对所导出的 MA 序列，用 ACF 决定 MA 部分的阶. 

EACF 的导出相对复杂 一些， 细节参见 Tsay 和 Tiao(1984). 但此函数很容易 
使用. EACF 的结果可以用一个一 维表格 表示，这个表的行对应于 AR 的阶 p ， 列对 
应于 MA 的阶 </• ARMA(l.I) 模型的 EACt 的理论形式由表 2-4 给出.这个表的主 
要特 征是： 它包含由“◦”组成的三角形，并且这个三角形左上角顶点位于阶 (1,1) 
处.我们止是用这样的特征来识别一个 ARJVIA 过程的阶.一般地，对 ARMA ( p , g ) 
模型，由 “0” 组成的三角形的左上角顶点位于仏，处. 

作为例子，考虑 3M 公司股票从 1946 年 2 月到 1997 年 12 月的月对数收益率. 
共有 (523 个观测值，收益率序列和它的样本自相关函数由图 2-9 所示. ACF 图表明 
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在 5% 的水平下序列没有显著的序列相关性.表 2-5 给出了样本 EACF 的值和对应 
的简表.简表是用如下记号来构 造的： 

(1) “x” 表示对应的 EACF 的绝对值大于或等于 2/v/f, 该值是 EACF 渐近标 
准误差的 两倍； 

(2) “0” 表示对应的 EACF 的绝对值小于 2/ v / T - 

表 2-4 ARMA(1 ， 1) 模型的 EACF 理论表，其中 “X” 代表非零， “O” 代表零 . 


代表零或者非零，它在识别阶 （ 1,1 ) 时不起任何作用 

MA 

AB 

0 


















■ 


WM 

o 


IB 


IB 




mm 

o 








mm 

o 








Hj 




■ 

IS 


m 





Kfl 





年 





问阱 

图 24) 3 M 公司股票从1946午2月到1997年12月的月对数收益率的 
时间阁和样本自相关函数图 

简表清楚地显示由 “O” 组成的三角形的左上角顶点位于阶（/;， g)=(0,0) 处.只 
有第一行的一个 “x” 是例外的，它对应的的样本 EACF 值为 0.()9, 只比 2/n/623 = 
0.08 稍大一点.因此， EACF 表明 3M 公司股票的月对数收益率服从一个 ARMA(0,0) 
模型（也就是一个白噪声序列).这与由图 2-9 中样本 ACF 所表明的是一致的. 
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表 2-5 3 M 公司股票从1946年2月到1997年12月的月对数收益率的 


样本 EACF 及其简表 







样本推广的自相关函数 











MA 的阶： r / 







P 

0 

1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

11 

12 

0 

- 0.05 

- 0.04 

- 0.07 

- 0.01 

1),02 

0.06 

- 0.00 

0.02 

- 0.01 

— 0.()6 

0.03 

0.09 

0.01 

1 

-0 49 

0.01 

- 0.06 

- 0.03 

0.00 

0.06 

0.01 

0.01 

- 0.01 

- 0.05 

0.02 

0 . U 8 

0.02 

2 

- 0.45 

- 0.18 

- 0.05 

0.01 

一 0.02 

0,06 

0.03 

0.02 

一0 m 

-0 00 

0.01 

0.05 

0.05 

3 

- 0.18 

0.15 

0.40 

- 0.01 

一 0.01 

0.05 

- 0.00 

0.03 

- 0.03 

一 0.00 

0.00 

0.02 

0.05 

4 

0.42 

0.04 

0,39 

- 0.08 

- 0.01 

0.01 

- 0.01 

0.04 

0.02 

0.02 

- 0.00 

0.01 

0.03 

5 

- 0.13 

0.24 

0.41 

0.07 

0.23 

U . U 1 

0.01 

0.05 

- 0.03 

0.02 

- 0.01 

0.00 

0,04 

6 

一 007 

- 0.37 

0.06 

0.31 

0.20 

- 0.09 

0.01 

0.06 

一 0.03 

0.02 

- 0 . 0 J 

U . 0 U 

U .03 


简化的 RAf ’ F 表 
MA 的阶： 


P 

0 

1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

11 

12 

U 

O 

O 

O 

0 

O 

O 

O 

O 

O— 

O 

o 

X 

o 

1 

X 

O 

O 

O 

O 

O 

O 

O 

0 

O 

o 

o 

o 

2 

ye 

X 

O 

O 

o 

O 

O 

O 

o 

O 

o 

o 

o 

3 

X 

X 

X 

0 

o 

O 

O 

O 

o 

O 

o 

o 

o 

4 

X 

O 

X 

O 

o 

O 

O 

O 

o 

o 

o 

o 

o 

5 

X 

X 

X 

0 

X 

O 

O 

O 

o 

o 

o 

o 

o 

6 

o 

X 

o 

X 

X 

O 

O 

o 

o 

o 

o 

o 

o 


前面所讨论的信息准则也可以用来选择 ARMA 模型.具体地,对于事先指定的 
正整数 P 和 Q ， 计算 ABMA ( p , q ) 模型的 AIC (或 BIC ), 其中 
并且选取使 AIC (或 DIC ) 取最小值的 模型. 该方法需要许多模型的最大似然估计, 
在一 些情形下可能会碰到在估计时过度拟合的困难. 

一旦 AUMA ( p . q ) 模型的阶确定了，它的参数就可以用条件似然法或精确似然 
法来 估计. 另外，残差的 Ljung - Box 统计量可以用来检验所拟合模型的充分性.如 

果模型是正确的， Q ( m ) 渐近地服从自由度为的 x 2 _ 分布其中"表示模型 
所用参数的个数. 

2 6.4 用 ARMA 模型进行预测 

和 ACF —样，只要将 IV 1 A 部分对低步数预测的影响进行调锒后， ARMA ( p , q ) 
模型的预测就会与 AR ( p ) 椹型的预测有相似的特征.设预测原点为/^ F h 为在/, 
时刻所能得到的信息集合 . ^ , I 的向前一步预测为 

P Q 

(!) — E (r/^ |F/j ) = + E ♦i r h+l - i — > 二 一 i, 

，’ =1 i—l 

相应的预测误差为 e A ( l ) = r h+1 - r h ( l ) = a h+1 . 向前一步预测误差的方差为 
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Var fr/, (1)] = (Ja- 对向前丨步预测，我们有 

p Q 

r h (/) = E (rh+i li* 1 /,) = + 52 伞九 (I - i) - 氏如 （f - i), 

i=l t=l 

其中，当 /-i 彡 0 时， f h (/-*) = r h + ,_ i ； 当 Z-i > ◦时， a h ( Z - i ) = 0; 当 f-i 彡 0 
时 „ 7l (/ - i ) =： ,, M 这样, ARMA 模型的向前多步预测可以递推算得.相应的预 
测误差为 

eh (0 = - r h (/) , 

它可以用 2.6.5 节给出的一个公式 (2.34) 很容易地算出. 

2.6.5 ARMA 模型的三种表示 

本节将简单地讨论平稳 ARMA ( p , q ) 模型的三种 表示. 这三种表示用于三种 
不同的目的.了解这二种表示会更好地理解 ARMA 模型. 第一种表示是（ 2 . 28 )式， 
这个表示很紧凑丼且在参数估 计时很有用. 另外.它也可用 I 1 递推计算 n 的向前 
多步预测，见 2.6.4 节的^论. 

对另外两种表示，我们用两个多项式比的级数展开式（长除法).给定两个多项 
式 0( C ) = 1- £ 和 0( B ) = 1 - f ： 6 X D \ 我们有 

i=l <— 1 

==1+咖丑+也炉+ ."三必（5)， (2-29) 

= 1 - - n 2 B 2 —— = 7 r ( S ). (2.30) 

例如， 若 = 1 - < hBMB ) = l - 心丑 ，则 

ip ( B ) = ^ —— = 1 {(pi — 0 \) D (pi (cpi — 6i ) B 2 + 4 >\ (0 i - 6? i ) B 3 + •.. i 

7r (B) = ^ — = l — (4>] — 9\) D - Q\{<t>\ — 6\) B 1 - 9^ (0i — $i) B 3 - . 

i — o\ts 

由定义知 xp { B ) iv ( B ) = 1, 利用 Br = c 对任意常数 c 成立这个事实（因为常数是 
随时间不变的)，我们有 


00 _ _^0_ 00_00_ 

00 ) = i-e l -V 硕 = \- 4>1 - % 


AR 表示 

利用 (2.30) 式的结果， AHMA ( p . q ) 模型可写成 


rt = ------ + 7 Txrt-l + ^2 r t —2 + 7 T 3 r t -3 I ••• + «<• (2.31) 

1 一 U \ —— • • • 一 f/q 
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这个表示给出了当前收益率 n 对过去收益率 ?•<_<， i > 0的依赖关系.系数 { tt ,} 称 
为 ARMA 模型的 7 T - 权重. 为了说明延迟值 r t _, 对 r t 的贡献随 7 :的增大而逐渐消 
失，系数 7T, 应随 i 增大而趋 于零. 一个 ARMA ( p , q) 模型如果具有这样的性质，则 
称它为可逆的 • 对纯 AR . 模型, 0( B ) = 1，故 = 0( S ). 这是一个有限阶的多项 
式.从而对 i > p 有巧= 0. 模型是可逆的.对其他 ARMA 模型，可逆性的充分条 
件是： 多项式 0 ( B ) 的所有零点的模大于 1. 例如，对 MA (1) 模型 r t = 

—■次多项式1 - 01打的零点是 B = l /0 i . 从而，如果1/ I&I > 1( 也即|化| < 1 ), 则 
MA (1) 是可逆的. 

由 (2.31) 式的 AR 表示，一个可逆的 ARMA ( p , g ) 序列是当前的“抖动” a , 
与序列过去值的加权平均的线性组合.对越来越远的过去值，权重 S 指数衰减. 

MA 表示 

问样,利用 （2.29) 式， AEMA ( p , q) 模型也能写成 

r t — /i + at + 十 i/j^t -2 H - = // 十矽 (B) a t , (2.32) 

其中 // = E ( r t ) = 0 o /( l -0. - < t > P ). 这个表示清楚地说明了过夫的 “ 扰动” 

a t - i(i > 0) 对当前收益 rv 的 影响. 系数{也}称为该 ARMA 模型的脉冲响应函 
数 (impulse response function). 对弱平稳序列，系数 V ，< 随》:的增加呈指数衰减. 
这一点是可以理解的，因为扰动山 _， 对收益率^的影响应该随时间而消失.这样， 
对平稳 ARMA 模型，扰动山_,不能对序列有永久的影响如果如/ 0,这样的 MA 

表示中有一个常数项 T 它就是 r t 的均值 （也即如 / (1 -扣- 〜)). 

(2-32) 式的 MA 表示在计算预测误差的方差时也是有 用的. 在预测原点\我 
们有 a h - i , -从而，向前 f 步预测为 

(0 =/i + i ) ia h 4 -+ ... ， (2.33) 

相应预测误差为 

c h (0 = < ih+i + x / fiah + i—i 十 ."+ ip 卜 

因此，向前 / 步预测误差的方差为 

Var [e h (l)] = (1 + # + … + O 】， (2.34) 

正如所料，它是预测时间长度 Z 的非减函数. 

最后， (2.32) 式的 MA 表示还提供了平稳序列均值回转的-个简单证明.平 
稳性意味着当 i — oo 时汍趋于零.从而，由 （2.33) 式，我 们有： 当 f -> oo 时， 
6 (/) 〜^ 因为心 （/) 是 r /,_ M 在预测原点/,的条件期望，丄述结果表示，从长期 
來看，收益率序列预期会趋丁它的均值，也就是说，序列是均值回转的.进一步地, 
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由 (2.32) 式的 MA 表示，我们有 Var ( r ,) = (l -f £ Vf ) 从而.由 （2.34) 式.当 

/ — oo 时， Var [e, t (Z)J -» Vai (r t ). h , (/) 趋于 /x 的 i 度决定了均值回转的速度. 

2.7 单位根非平稳性 

到目前为止，我们的注意力还是集屮在平稳的收益率序列上.在某些研究中， 
利举、汇率或资产的价格序列是研究对象.这些序列往往是非平稳的.对于资产价 
格序列，其非平稳性主要是由 f 价格没有固定的水平.在时间序列文献中，这样的 
非平稳序列叫做单位根 ( Unit - root ) 非平稳序列.单位根非平稳序列最著名的例子是 
随机游动模型. 

2.7.1 随机游动 

若时间序列满足 

p t = pt-i + a t , (2.35) 

其中 p u 是一个实数，表示这个过程的起始值，是一个白噪声序列，则称 { p ,} 
为一个随机游动.若为一支股票在第 < 天的对数价格，则 PQ 可以是该股票最初 
上市 (initial public offering) 的对数价格（简称为“对数 IPO 价格”) .若的分布 
关 于零点 对称，则给定川-!的条件下 . 上升或下降的机会各有50%,也即内将 
随机地上升或下降.如果我们把随机游动模型看成个特殊的 AR (1) 模型，那么 
Pr - i 的系数是1，这不满足 AR ,(1) 模型平稳性的条件.从而，随机游动序列不是弱 
平稳的，称之为单位根非平稳时间序列. 

随机游动模型吋广泛地用来作为对数股价运动的统计模型.在这样的模型下， 
股价不是可预测的或均值回转的.下面说明这 一点： 模型 (2.35) 在顸测原点/»的 
向前一步预测为 

Vh (1) = E ( p/ t+ i \ p h , Ph - l ,--) = Ph ， 

它就是预测原点的对数股价，这样的预测没有实际意义.向前两步预测为 

Ph (2) = F, (/)/, | 2 lr ， h,Ph i, • • •) = E (phi 1 4 - n.h +2 IPh,Ph-t 
=E (ph^-l * •) = P/» C 1 ) = l J h, 

这又是预测原点的对数股价 _ 事实卜.对仟意的预测步长 f > 0,都有 

Ph (0 = Ph - 

这样.对所有预测步长，随机游动模型的点预测都是序列在预测原点的值.从而，该 
过程不是均值回转的. 
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(2.35) 式给出的随机游动模型的 MA 表示为 

Pt = + d/ - 1 + (Zf — 2 + • • • • 

这个表示有几个重要的实际 意义. 首先，向前 z 步预测误差为 

e h (0 = Qh+l + . . • + , 

从而 Var [ e ,, (/)] = 当丨 — oo 日、 j 发散到无穷.因此，随着饨测步长的增大 ，办 
的预测区间的长度将趋于无穷.这表明，随着/的增大，点预测抛 （/) 变得没有用 
处.也再次说明了该模型不是 nj •预测的.其次，因为当/增大时. Var[ e/l (/)] 趋于无 
穷，仍的无条件方差是尤 界的. 理论上讲，这意味着对充分大的 （，的 可取到任何实 
值.对个股的对数 价格巧 来说，这一点还说得过去，但对市场指数来讲.负的对数 
^格即使有也是很少见的 ： 从这个意义上讲，随机游动模型对市场指数的适合性值 
得 怀疑. 最后，从上述表示看，对所有有私 = 〖，这就是说，任何过去的“扰动，， 
叫- ，对内的影响均不随时间衰减，从而，序列有强记忆性，因为它记得所有过去的 
“扰动”.在经济学上，这种现象就是“扰动”对序列有持久的效应.单位根时间序列 
的强记忆性也可以从样本 ACF 看 出来. 当样本容暈增大时，样本 ACF 都趋于 1. 

2-7.2 带漂移的随机游动 

如前面一些实证例子 所示. 市场指数的对数收益率序列会有小的正均值这蕴 
涵着对数价格的模型应为 

Pt = + Pt-i + a t , (2.36) 

其中 /z = E ( p ,- p t _,), {«/} 是白噪声 序列. 模型 (2.36) 中的常数项在金融研究中 
很重要.它表示的是对数价格的时间趋势，通常称其为模型的漂移 （ drift ). 为 
广说明这一点，我们假定初始价格为 Po , 从而我们有 

Pi + Po + a !， 

P2 = /^ + Pi + a2 = 2/i + po + a2 + ai , 


Pt = tfi + pa A- at at-\ + ... + ai. 

上式屮最后一个等式表明对数价格由时间趋势^和一个纯随机游动过程全 a ，组 

成.因为 Var 其中4为 a , 的方差，灼的条件标准差为，它比 

Pt 的条件 期望逼 长的速 度慢. 从而，如果画出的随时间指标/变化的阁像，我们就 
有一个斜率为/ I 的时间趋势.正斜率/ X 蕴涵着对数价格最终趋于 oo , 负斜率 " 蕴 
涵着对数价格将趋于_00.基于这个讨论， CRSP 价值加权和等权重指数的对数收 
益率序列有小的、但是统计显著的正均值这个现象就不足为奇了. 
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为了说明价格序列漂移参数的效应，我们考虑 3 M 公司股票从 in.lfi 年 2 月到 
11)97 年12月的月对数收益率.如表 2-5 中的样木 EACF 所示，该序列无显著的序 
列相关性.该序列服从简单的模型 

r t = 0.011 5 + a tl cr a = 0.0 fi 3 9 ? (2.37) 

其中 （).011 5 是 r , 的样本均值，其标准误差为 0. U 02 6. 3 M 公司股票的月对数收益 
率在1%的水平下是显著不同于零的.我们利用对数收益率序列来构造两个对数价 
格 序列： 

t t 

pt = Xi r<, p? = 

其中 a 是 (2.37) 式中的均值修正对数收益率（也即叫 = n - 0.011 5). p * 是 3 M 
公司股票的对数价格,假设初始价格为 0( 也即 I 946 年1月的对数价格为 0). 是 
当对数收益率的均值为0时对应的对数价格.图 2 -1 () 所示的是 p , 和％的时间图. 
还有直线?/, = 0.011 5/. 从该图中可以看出， (2.37) 式中的常数 0.0115 的重要性是 
明显的.另外.如我们所料， P , 上升趋势的斜率大致为 0.011 5. 


- 1 I I I I 1 

lOWl 19GU 1970 198U 1990 2000 

年 

图 2-10 3 M 公司股票从1946年2月到1997年12月的对数价格的时间图.假定1946年 
1月的对数价格为0虚线为没有时间趋势的对数价格,直线为 y , = o.on 5/ 

最后 应指出的是，理解时间序列模型中常数项的意义是重 要的. 首先，对 (2.22) 
式中的 MA (7) 模型.常数项就是序列的均值：其次，对 (2.9) 式屮的平稳 AR{ ； P) 
模型或 (2.28) 式中的平稳 ARMA ( p , q ) 模型，常数项与均值有关，关系为 P = 

- 0 p ). 最后，对带漂移的随机游动，常数项成为了时间 斜举. 这 

些关于时间序列模型中常数项不同的解释.清楚地阐明了动态模型与通常的线性回 
归模型之间的不同. 

动态模型与回归模型之间的另一个重要差别可用 AR (1) 模型和简单的线性回 
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归模型来 说明: 


rt = 0 o + 4nr t -i + fl t ， Vt =0o + 0ixt+a t . 

要使 AR (1) 模型有意义，须使系数和满足 I 咖 I < 1,而系数 A 可以是任何固定的 
实数. 

2.7.3 带趋势项的时间序列 

与刻画线件趋势紧密联系的一个樽型是如下带趋势项的时间序列 模铟： 

Pt = Po + Tt , 

其中是个平稳时间序列，例如平稳 AR { jj ) 序列.这里，随时间以汍的速 
率线性增长，囚此能够刻画类似于带漂移的随机游动模型的行力.然而，这两个模 
型有一个土要的区别.为了说明这一点，假定 Pu 是固定的.带漂移的随机游动模 
型假定均值是 E(p t ) = p 0 -h ftL 方差是 Var ( p f ) = 两者都依赖于时间.另一方 

面，带趋势项的时间序列模型假定均值是 E ( p t ) = + 它依赖于时间.而方差 
是 Var ( p f ) = Vax ( r ,), 它是有限的且不随时间变化.带趋势项的时间序列模型可以 
通过简单的回归分析移除掉时间趋势而转换为平稳时间序列.关于对带趋势项的 
时间序列模型的分析，可参见 2.9 节. 

2.7.4 —般 的单位根非平稳模型 

考虑 ARMA 模型.如果我们把 ARMA 模型推广到允许其 AH 多项式以1作 
为它的特征根.则模型就变成 f 众所周知的自回归求和滑动平均 （ ARIMA ) 模型. 
因为其 AR 多项式有单位根1，故 ARIMA 模型称为是单位根非平稳的.像随机游 
动模型一样， ARIMA 模型有强记忆性.因为它的 MA 表示中的也系数不随时间衰 
减，从而过去的扰动对序列有持久效应.处理单位根非平稳性的惯用方法是用 
差分化 (differencing). 

差分化 

个时间序列讲称为是个 ARIMA (^, 1, q ) 过程，如果变换后的序列 c t = 
yt - Vt -\ = (1 - B ) y t 服从一个平稳可逆的 ARMA ( p , q ) 模型. 在金融中.通常认 
为价格序列是非平稳的，而对数收益率序列 n = ln ( p t ) - ln ( p t _!) 是平稳的.这时， 
对数价格序列是单位 根非平 稳的，从而可当作 AR 1 MA 过程对待.在时间序列文献 
中.通过考虑时间序列相邻两值的变化量所构成的序列.把一个非平稳序列变换成 
—个平稳序列，这样的思想叫做差分化.更止规地说，称 C t = m - Vt i 为 y t 的一 
阶差分序列.在有些科学领域，时间 序列讲 可能会有多重单位根.需要做多次差分 
才能变成平稳序列.例如.若，的和它的一阶差分序列 C t = y t - !h ^ 都是单位根非 
平稳的.但 Sk = c t - t.t 一 1 = !h - 27/ t-i -f- y t - 2 是弱平稳的，则 Z /< 就有双重单位根， 
是:的二阶差分序列.若服从 ARMA ( jj , q ) 模型，则是 ARIMA ( p , 2, q ) 
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过程. 对这样一个时间序列，若〜有非零的均值，则有一个二次时间函数，这个 
二次时间函数的系数与々的均值有关.进行季节性调节后的美国季度国民总产值 
暗含的通货紧缩 (implicit price deflator ) 序列可能会有双重单位根.但该序列的二 
阶差分序列的均值并不是显著地不同于零的（见本章末的练习题). Box , Jenkins 和 
Reinsel (1994) 讨论了一般 ARIMA 模型的很多性质. 

2.7.5 单位根检验 

为了检验资产的对数 价格川 是否服从一个随机游动或一个带漂移的随机游动, 
我们利用如下两个模型 


Pt = + e tl (2.38) 

Pt = I c t , (2.39) 

其中 e ， 为误差项.考虑原假设 Hq : ( j )\ = 1对备择假设 // u : < 1. 这是一个著名 
的单位根检验问题.参见 Dickey 和 FuUer (1979). —个方便的检验统计量就是在原 
假设下如的最小二乘估计的 t -比.对 （2.38) 式，由最小二乘法可得 

: ZLlPt-lPt .2 (pt - 4> lPt - l ) 

其中 po = o, r 为样本容量. 比为 

DF = t — = 心 一 1 = ^t-1 Pt-I c t 

_ _娜准差、 

这个 比通常称为 Dickey-Fuller 检验.若 { e t } 是一个白噪声序列，其稍高于二 
阶的矩是有限的.则当 r — 00时 DF - 统计量趋于一个标准布朗运动的函数，更多 
的有关信息可参见 Ck " 和 WeiO 988 ) 和 Plullips (1987). 如果 <h = 0 但我们采用了 
(2. M ) 式，则所得的检验 心=1 的 /- 比将趋于另一种非标准的渐近分布.上述两 
种情形都是用模拟方法来得到检验统汁量的临界值，部分临界值参见 Fuller (1976) 
的第 8 章. 然而，如果 如 / 0 fL 使用的是 （2.39) 式，则用来检验 和 - 1 的比是 
渐近正态的，但此时将需要很大的样本容量来保证渐近汇态分布的使用.标准布朗 
运动将在 本竹笫 G 章介绍. 

对许多经济时间序列而言， ARIMA ( p , d , q ) 可能比 (2.3.9) 式给出的简单模型 
更适合.在 i | 量经济文献中，经常使用的是 AR ( p ) 模型，用: c , 表示该序列.为了验 
证在 AR { p ) 过程中是否存在单位根，可以用如下回归来检验原假设执,：= 1对 

H a : (3 < 1 ： 

P — 1 

x t = c t -\- 0 x t -\ + + e t (2.40) 
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其中 q 是关于时间指标/的确定性函数，△: r , = 巧 是 A 的差分序列.在实 
际中， q 可以是零，常数，或者 q — u；o + uJit . 0—1 的*-比为 


ADF - 检验 


/) 的标准差’ 


其中为/3的最小二乘估计，上述 f - 比就是著名的扩展的 Dickey-Fuller 单位根 
检验.注意到由于一阶差分， (2.40) 式等价于一个带确定性函数 c , 的 AR ( i >) 模型. 
(2.40) 还可以改写为 


Ait = c t + 0 P xt _ t + ^ et, 

i=l 

其中 0 r .=0- l . 我们可以等价地检验 // 0 :尽 = 0 对 // a : /? c < 0. 

例 2.2 考虑美国从1947年第一季度到 200： i 年第4季度的季度 GDP 的对数 
序列.该序列呈上升趋势.表明美国经济的增长，另外，该序列有高度的序列相关 
性，见图 2-11 的左侧.一阶差分序列表示美国 GDP 的增长率，这也在图 2-11 中 
给出. 该差分序列似乎在一个固定的均值附近变化，尽管这种变化在最近几年比较 
小.为了证实所观察到的现象，我们对数序列进行 Dickey - Fidlcr 单位根检验.基 
于图 2 _1 ] 给出的差分序列的样本 PACF , 我们选择 p = 10. 我们还用了一些其他 
的的值，然而都没有改变检验的结 论：当 p =10 时 ADF 检验统计 M 是 -1.131, 
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图 2-11 美国从1947年第一季度到2003年第4季度的季度 GDP 的对数序列： （ a ) X 十数 
GDP 序列的时 间图； （ b ) 对数 GDP 序列的样本 ACF ; ( c ) 一阶差分序列的时 间图; 
( d ) 差分序列的样本 PACF 
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V 值是 0.703 8. 表明单位根假设不能被拒绝.由下面的 S-Plus 输出结果知，夕 = 

i + 4 = i- o.nnn f. = n.MQ a . 

S-Plus 演不 

输出结果. 

> adft=unitroot(gdp,trend=* c* 4 method= ， adf*,lags=10) 

> summary(adft) 

Test for Unit Root ： Augmented DF Test 

Null Hypothesis : there is a unit root 
Type of Test : t test 
Test Statistic ： -1.131 
P-value ： 0.7038 

Coefficients : 

Value Std. Error t value Pr(>|t|) 
lagl -0.0006 0.0006 -1.1306 0.2595 
lag2 0,3797 0.0679 5.5946 0.0000 

lagio 0.1798 0.0656 2.7405 0.0067 

constant ： 0.0123 U.0048 2.5654 0.0110 

Regression Diagnostics : 

R-Squared 0.2831 
Adjusted R-Squar^d 0.2485 

Residual standard error : 0.009498 on 214 degrees of freedom 

作为另外一个例子，考虑 S&P500 指数从 1990 年 1 月到 2003 年 12 月的日对 
数收益率序列，共有 3 532 个观测值.阁 2-12 给出了该序列的时间图.如果想从实 
证的角度去验证该指数是否服从带漂移的随机游动，则进行单位根检验是必要的. 


7.0 

琴 0.5 

6.0 

199U 1902 1904 199G 1098 20(H) 2002 2U04 

年 

图 2-12 S & P 500 指数从1990年1月2日到2003年12月31日的对数 H 收益率的时间图 
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为此，在应用扩展的 Dickey-Fuller 检验时用 c, = 进一步,我们选择 p = 14, 

这是因为对子一阶差分序列， Air 选择了 AH(l：i) 模型.检验统计量的倌为 -0.9648, 
p 值为 0.946 9. 因此，在任何合适的显著性水平下，单位根检验都不能被 拒绝然 
而，在通常的5%的显著性水平下，对确定性项的参数估计与零没有显著差异.综上 
所述，在所考虑的时期内，指数的对数序列包含一个申 位根. 但是没有很强的证据 
表明该序列有时间趋势. 

S-Plus 演示 
输出结果. 

> adf t=unitroot(sp,method^ # adf 、 trend= # ct # , lags=14) 

> aurninary (adf C) 

Test for Unit Root : Augmented DF Test 

Null Hypothesis : there is a unir root: 

Type of Test ： t test 
Test Statistic: -0.9648 
P-value : 0.9469 

Coefficients : 



Value 

Srd. Error 

t value 

Pr(>111 

lagl 

-0.0008 

0.0008 

-0.9648 

0.3347 

lagl4 

0.0319 

3.0169 

1.8894 

0.0589 

constant: 

0.0056 

D.0054 

1.0316 

0.3023 

time 

0.0000 

D.0000 

0.4871 

0.6262 


Regression Diagnostics : 

R-Squared 0.0107 

Adjusted R-Squared 0.0065 

Residual standard error : 0.01049 on 3514 degrees of freedom 

2.8 季节模型 

有些金融时间序列，如公司股票每股的季度盈利，呈现出一定的循环或周期性. 
这样的时间序列叫做季节性时间序列.图 2-13a 所示的是 Johnson aiui Johnsou 公 
司每一股份的季度盈利的时间图，时间是从 19()U 年第1季度到1980年最后一个 
季度.此数据集来自于 Shiimway 和 Stoffer(2000), 它呈现出一些特殊的 特征. 特别 
地，我们可以看到在样本期问内盈利呈指数型上升，并有很强的季节性.另外，随时 
间的推移，盈利的变化性在增加.其循环形式每年重复一次，从而此序列的周期是 
4. 如果我们考虑的是月数据（如 Wal-Mart 商店的月销售额)，则周期是 12. 季节性 
时间序列模型在给与天气有关的衍生产品定价和能源期货的定价方面也是有用的, 
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I960 1965 1970 1975 1980 

年 

图 2-13 Johnson and Johnson 公司股票从 19( j () 年到1980年每股的季度盈利时 间图： 
( a ) 观察到的盌利， （ b ) 对数盈利 

记对数盈利为 : c t •图 2- M 的左上角是心的样本自相关函数图.它表明每股的 
季度对数盈利具有强的序列相 关性. 处理序列的这种强序列相关性的一个惯用的 
方法是考虑: Ct 的一阶差分序列（也即△: c , = x t - X / 1 = ( 1 - 阁 2-14 的左 


因为绝大部分与环境有关的时间序列都会显示出很强的季节性. 

季节性时间序列的分析已有很长的历史.在有些应用中.季节性的重要性是次 
要的.我们可把它从数据中消除.得到经季节性调整后的时间序列，然后再用来做 
推断. 从数据中消除季节性的过程叫做季节调整 (seasonal adjustment). 美国政 
府公布的多数经济数据是经季节调整的 （如 GDP 的增长率和失业率).在其他一些 
应用中，如进行预测时，数据的季节性和其他特征一样重要，必须进行相应的处理. 
因为预测是金融时间序列分析的一个主要0 的. 故我们把注意力放在后一个话题 
上，并讨论一些在季节性时间序列建模中有用的经济计量模型. 

2.8.1 季节性差分化 

图 2-13 b 所示的是 .lolmson and Johnson 公司每股对数盈利的时间阁.我们进 
行对数变换有两个 原因： 一是处理序列的指数型增长，新的时间图证实了序列取对 
数后的确是线性增 长的： 二是对数变换用来稳定序列的波动性.图 2-13 a 中的序列 
的波动有上升趋势，这种上升趋势在新图中已经消失.对数变换在佥融、经济的时 
间序列分析中是常 用的. 在这个貝体例子中，因为盈利是正的.所以在变换之前不 
须作调整.而在有些场合，我们需要对每个数据点加上一个正常数后再作对数变换. 


( a ) 母股盈利 



( I .)每股对数盈利 



SIS 
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下角是的样本自相关函数图，可见当间隔是周期4的倍数时相关性强，这是季 
节性时间序列的样本自相关函数的典型表现.按照 Box ， Jenkins 和 Reinsel (1994) 
的第9章的内容，我们对△: r t 作另一个差分，也即 

△4 (Ax f ) = (l — B 4 ) Ax t = Ax, — Ax t -4 = x t x t -i x t ~4 + 

算子 △* = 1 - 召 4 叫做季节性差分化 (seasonal differencing). —般地，对一个周 
期为《的季节性时间序列 y tl 季节性差分意指 

△ 说 = Vt- yt-t, = (1 - B a )y t . 

通常的差分 Aj/f = — yt-\ = (1 — B) yt 叫做正规差分化 (regular differencing). 

图 2-14 的右下角是的样本自相关函数 t 它在间隔为1处有一显著的负值， 
在间隔为4时有一个稍强的负相关.为，完整性，图 2-14 还给出了季节差分序列 
的样本自相关函数图. 


序列 ： r 



0 5 10 15 


间陏 


序 列：心 • 



序列：心 



N 隔 

序列： djrl.s 



间隔 间隔 

图 2-14 Johnson and Johnson 公司股票从1960年到1980年每股季度盈利的对数序列的样 
本自相关函数.其中 x t 是对数盈利， “cLc” 是一阶差分序列， “ds” 是季节性差分序列， 
“dzds” 表示经止规差分后冉季节差分的序列 

2.8.2 多重季节性模型 

图 2-14 中 (1 - S J ) (1 - B ) x t 的样本 ACF 的表现在季节性时间序列中是常 
见的.它使我们引进了下面特殊的季节性时间序列 模型： 

(1- B S )(1 - B ) x t = {\- 6 B ){1 - (2.41) 

其中 .9 是序列的周期，是白噪声序列，|0| < 1， | B | < 1. 此模型在文献中称 
为航空模型 (airline model )， 见 Box , Jenkins 和 Reiiisel (1994) 第9章.它被广泛 
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地应用于季节性时间序列的建模.此模型的 Aft 部分由正规差分和季节差分两 
部分组成，而 MA 部分包括两个参数.下面将精力放在该模型的 MA 部分，记 
.叫 =(i 那么 

w t = (1 - OB ) (1 — 0 Z ? S ) a t = at — Oat l — ^ at-a + 

其中 s > 1. 容易得到 E ( u ; t ) = 0,并且 

VarK) - (1 + 9 2 ) (1 + © 2 )^, 

Cov {w ly vh-\) = -6 (1 + © 2 ) al ， 

Cov { w t , Wt - a + l ) = 

Cov (w t ,w t -s) = -0 (1 + 6 2 ) o-l, 

Cov ( w t , w t - a - i ) = OGal ， 

Cov ( w t , Wt - l ) = 0, 其中 Z ^ 0, 1, S — i , S ,5+ 1. 

因此，叫的 ACF 为 

一 0 一 ㈠ 00 

p, = TT^ 1 p ， = TT02' P*-1 = Ps+1 = PiP„ = (1 + 02)(1 + 02) . 

而对 / > () 但 / 笋 l ,. s - l ，. s , s + 1 有仍 = 0. 例如，如果 u ;, 是季度时间序列，那么 
,s = 4且它的 ACF 只在间隔1，3, 4, 5处非零. 

把卜述 ACF 与 MA (1) 模型讲 = (1 和 MA ( s ) 模型 = ( l -0 I ? a ) a t 

的 ACF 相比较会看出有意思的结论 . 和 2 ，的 ACF 分别是 

pi ( u ) = 1 +: 2 和 p ，（ j /) = 0， / > l ； 

Pn (■*) — 1 + q 2 和内（ 2 ) = 0， Z >0 丘 1^3. 

我们看到 ( a)^i = Pi ( i /); ( b ) p a - p a ( 2 ); ( c ) p 4 _! = p s+ x = Pi ( y ) x p s [ z ). 从而， 
在间隔 •《» - 1 和 . s + 1 处的 ACF 可以认为是间隔为 1 和间隔为 . s 的序列相关性相 
互作用的结果.叫的模型称为多重季节性 MA 模型.实际中，多重季节性模型意 
味着序列的正规部分与季节部分的动态结构是近似正交的. 

模型 


w , = {I - 6D - fiB 8 ) a t , |( 9 | < 1 , | B | < 1 ( 2 . 42 ) 

是•个非乘积季节性 MA 模型.易见.对 （ 2 . 42 ) 式的模型有 p H+l = 0 . 乘枳模型比 
对应的非乘枳模型更节省，这是因为虽然內个模型用 f 相同数目的参数，但乘积模 
型有更多非零的 ACF . 
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例 2.3 在此例中，我们把航空模型应用到 Johuson and Johnson 公司股票从 196() 
年到〗 9 80年的每股季度盈利的对数序列上去.基于精确似然法所拟合的模型为 

(1 - B )( l - D 4 ) x t = ( i - 0.678/?) (1 - 0.314/? 4 ) a t , & a = 0.089, 

其中两个 MA 参数的标准误差分别为 0.080 和 ().101. 残差的 Ljuug - Box 统计量为 
Q (12) = 10.0, 其 p 值为 0.44. 模型看起来是充分的. 

为了说明上述季节性模型的预测表现，我们利用前 7 G 个观察值重新估计模型 
的参数，而把最后8个数据点用来进行预测评价.以 /t = 76为预测原点计算向前 
1步至8步预测值和它们的标准误差.为得到每股盈利的预测值，利用第1章中给 
出的正态分布与对数正态分布之间的关系.先进行一个反对数变换.图 2-15 给出了 
模型的预测表现，其中实线表示实际观察值，点预测值用一些点表示，两条虚线所 
示的是95%的区间预测.预测值显示出强烈的季节性，并与实际观察值相近.最后， 
对季度盈利建模还有其他方法，可参见本书 11.7 节. 

当一个时间序列的季节性表现随时间稳定的（也即，近似于确定性函数）时候， 
可用哑变量 (dummy variable ) 来处理季节性.有些分析师就采用这种方法.然而, 
确定的季节性只是前面讨论的乘积季节性模型的一个特殊情形，如0 = 1时.模 
型 (2.41) 包含一个确定的季节性成份.因此，当季节件是确定的时候.用哑变量或者 



图 2-15 Johnson and . lolinson 公司股票侮股季度盈利的点预测和区间预测.预测原点是1978 
年的第4季度.实线表示丈际观测倌.黑点表示点预测值两条虚线表示的是95%的 
区间预测 

用乘积季节性模型都能得到相同的预测结果.但是.当季节性不确定的时候，哑变 
量方法会导致较差的 预测. 在实际中，我们建议用精确似然法去估计一个乘枳季节 
性模型.特别是当样本容量较小或可能存在一个确定的季节性成份时. 

例 2 . 4 为了说明确定性的季节性，考虑 CRSP Uecilc 1指数从 I 960 年1月到 
2 00；3年 I 2 月的月简单收 益率. 共有528个观测.图 2-16 a 给出 f 序列的时间图，该 
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图并没有显示出序列有季节性.然而，图 2-16b 给出的样本 ACF 在间隔为 12, 24, 
30以及〗处显著的不为 0. 如果接受季节 ARMA 模型.则模型具有以下 形式： 

(1-01 B)(l- </>i 2 B 12 )R t = c+(l- e l2 B l2 )at, 

其中风表示月简单收益率.用条件似然方法所拟合的模型是 

(1 - 0.25丑)（1 — 0.99 fi 12 )7 ? t = 0.0004 + (1 — 0.92 召 12 ) a t , b a = 0.071. 

MA 系数靠近1,表明所拟合的模型接近于不可逆.如果用精确似然方法，我们有 

(1 - 0.2645)(1 - [).996B l2 )R t = 0.0002 + (1 - 0.999 B 12 ) a t , b a = 0.067. 



间隔 问隔 

图 2-16 CRSP Decile 1衍数从1960年丨月到2003年12月的月 简申收 益率： （ a ) 简单收益 
率的时间阍； （ b ) 简单牧益率的样本 ACF ; ( c ) 调整1月效应后的简单收益率的时间 
图； （ d ) 调整1月效应后的简单收益率的样本 ACF 

可以清楚地看到季节 AR 和 MA 因子之间的取消.利用精确似然方法以及估计的 
结果说明可能存在确定性的季节性.为了进一步证实确定性季节性的存在，我们关 
于1月份定义哑变量.即 

, \ 1,若/在1月份内， 

一“其他. 

并应用简单的线性回归 

A = A) + /?i Jaiif + . 
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图 2-16 的右侧给出了上述简单线性回归残差的时间图和样本 ACF . 从样本 ACF 
来看.在仟何间隔为12的倍数处都没有序列相关性.这表明通过1月份哑变量己 
经成功地消除了季节性因此 ， Decile 1的月简单收益率的季节性主要是由于1月 
效应 (January effect) 产生的. 

SCA 演示 
输出结果. 

tsm ml. model (1)(12)decl=cl+(12}noise• 
estim ml. hold resi(rl) 

SUMMARY FOR UNIVARIATE TIME SERIES MODEL -- Ml 


VAR TYPE OF ORIGINAL DIFFERENCING 
VARIABLE OR CENTERED 


DEC1 RANDOM ORIGINAL NONE 


PAR. VAR. 

NUM./ 

FACTOR 

ORDER 

CONS- 

VALUE 

STD 

T 

LABEL NAME 

DENOM 

* 


TRAINT 


ERROR 

VALUE 

1 Cl 

CNST 

1 

0 

NONE 

. 0004 

. 0003 

1.11 

2 DEC1 

MA 

1 

12 

NONE 

.9213 

.0205 

44.90 

3 DEC1 

AR 

1 

1 

NONE 

.2496 

.0419 

5*95 

4 DEC1 

AK 

2 

12 

NONE 

• 9943 

. 0094 

105.71 

EFFECTIVE 

NUMBER OF OBSERVATIONS 



515 


K-SQUARE • 

• • • 

• « 參 •■争 

« • • 

• • 

0. 

207 


RESIDUAL STANDARD 

ERROR.. 

• • • 

.• 0 • 

7056G2E-01 



estim ml. method exact. hold resi(rl) 

SUMMARY FOR UNIVARIATE TIME SERIES MODEL - - Ml 


VAR. TYPE OF ORIGINAL DIFFERENCING 
VAR. OR CENTERED 


DEC1 RANDOM ORIGINAL NONE 


PAR. VARI. 

NUM. / 

FACTOR 

ORDER 

CONS- 

VALUE 

STD 

T 

ItARET, NAME 

DENOM. 



TRAINT 


ERROR 

VALUE 

1 Cl 

CNST 

1 

0 

NONE 

.0002 . 

0002 

.67 

2 DEC1 

MA 

1 

12 

NONE 

. 9989 . 

0156 

63 .33 

3 DEC1 

AR 

1 

1 

NONE 

.2638 . 

0424 

6.23 

4 DEC1 

AR 

2 

12 

NONE 

.9963 . 

0058 170.55 


EFFECTIVE NUMBER OF OBSERVATIONS . 

R-SQUARE . 

RESIDUAL STANDARD ERROR. 


515 

0.283 

0.670734E-01 












70 第 2 章线性时间序列分析及其应用 


2.9 带时间序列误差的回归模型 


在许多应用中.主要的兴趣在于研究两个时间序列的关系.金融中的市场模型 
就是一例，其中，在市场模型中，我们需要找出个股收益率与市场指数收益率之间 
的关系.利率的期限结构也是一个例子，这时要研究的是不同期限的利率之间的关 
系怎样随时间演变.这些例子导致我们考虑如下形式的线性 回归： 

r u = a + 0 r 2 t + e t , (2.43) 

其中 ru 和是两个时间序列， e t 表示误 差项. 经常用最小二乘 ( LS ) 方法来估计 
模型 （2.43) .若 { e t } 是白噪声序列，则 LS 方法给出的估计是相 合的. 然而，在实际 
中经常遇到误差 e t 是序列相关的情形.这时，模型 (2.43) 就是一个带时间序列误 
差的回归模型，并且最小二乘法 ( LS ) 所产生的 u 和的估计可能是不相合的 • 

带时间序列误差的回归模型在经济、金融屮有广泛应用，但它也是最经常被误 
用的经济计量模型之一，因为^的序列相关性经常被 忽视. 故应该对此模型进行仔 
细研究. 

我们通过考虑如下两个美国的周利率序列之间的关系来介绍该模型 • 

• r lt ： 一年期固定期限国库券利率. 

. r 3 t ： 三年期固定期限国库券利率. 

这两个序列都以百分数给出，观测时间都是从1962年1月4日至1999年9月10 
日，都有1967个观察值，并且是从圣.路易斯联邦储备银行得到的_严格来讲，应 
该利用第8章中的多元时间序列分析对这两个利率序列联合建模.然而，为了简筚 
起见，我们将注意力放在冋归类型的分析卜，并民忽略它们的同时件. 

图 2-17 是上述两个利率序列的时间图，实线是一年期的利率，虚线是三年期的 
利率.图 2-18 a 是对 r 2< 的散点图，正好弓预期的一样,这两种利率是高度相关的 • 
描述这两种利率之间的欠系的一个自然方式是利用简单的模型 = a + /^ r u + Ct , 
所拟合的模型是 

r 3t = 0.911 + 0.924 r u I c t , < r e = 0.538, (2.44) 

其中 il 2 = 95.8%, 两个系数的标准误差分别为 0.032 和 0.004. 模型 (2.44) 证实 
了两种利率之间的高度相关性.然而，由阌 2-19 所不的该模型残差的时间罔及残 
差的 ACF 可见，该模型是严重地不充分的.特别地，残差的样本 ACF 是高度显 
著的并且缓慢衰减.显示出单位根非平稳时间序列的特点.残差的表现说明两种利 
率间存在明显的差异.利用现代经济计量方法，如果我们假定两个利率序列都是单 
位根非平稳的，那么 (2.44) 式中残差的表现说明这两种利率序列不是协整的 （co 
integrated ) (见第8章中关于协整的讨论).换言之，数据不支持关于两种利率间存 
在长期均衡关系的 假设. 从某种意义上讲，这并不让人感到意外.因为“逆收益曲 
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-年期利率变化& 


图2 18 从1962午1月5日到1009年!）月10日美国周利举的散点图： （ a ) 三年期对一年 
期三年期利率的变化暈对一年期利卒的变化 M 

两个利率序列和 (2.44) 式中的残差的单位根非平稳性使我们想到了考虑利率 
变化量序列. 

令 

(1) c\ t = r u — ri . t-i =(l — B ) rie , t ^ 2: 一年期利率的变化量； 

(2) cat = - rs,*_i =( i - B ) r 3< , 0 2： 三年期利率的变化量， 


1970 


T 

1980 


1990 


2000 


年 


m 2-17 从 19 fi 2 年1月4日到1999年9月 m 日美国周利率（百分比）的时间阁.实线是一 
年期固定期限国库券利率.虚线是三年期固定期 限国库 券利率 


lfH 



(H) 


1.5- 


线” (inverted yield curve ) 在数据所在的时间段内出现了. “逆收益曲线”指的是利 
率与它们离到期日的时间长短逆相关. 





±3 杂 Kn 








72 第 2 章线性时间序列分析及其应用 
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1980 

年 


I 獅 


21KMI 


阁 2-20 从 19 G 2 年1月12日到1999年 i) 月10日美国周利率变化景序列的时 间图: 
(a) 一年期固定期限国库券利率的变化； （b) 三年期固定期限国库券利率的变化 


(«) 






间瞄 

图 2-19 两种关国周利半的线性回归 (2.44) 式的残差序列： （ a) 时间图： （ b) 样本 ACF 

并考虑线性回归= a +加 14 •图 2-20 所示的是两个变化量序列的时间图, 
而图 2-18 b 所示的是它们之间的散点图.这两个变化序列仍然是高度相关的.为它 
们拟合的线性回归模型为 

cat = 0.000 2 + 0.781 lc lt + e t ，< x c = 0.068 2, (2.45) 

(a) 




5PP .Jod 
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其中炉= 84.8%,两个系数的标准误差分别是 ().001 5和 0.007 5. 此模型进一步证 
实了两种利率间很强的线性相关性.图 2-21 给出了 (2.45) 式的残差的时间图和样 
木 ACF , 这个样本 ACF 又表明残差中有一些显著的序列相关性.但相关系数的绝 
对值要小得多.残差的这种弱序列相关性能用前面几节中讨论的简单时间序列模 
型来描述，从而得到一个带时间序列误差的线性回归. 


•■*** 1111 
1970 198U 199() 2()00 

年 
0 >) 

0.8 - 
< 0.4- 

0 . 0 - 

I I I I I I I 

0 5 10 15 20 25 30 

_ 

阁 2-21 两种美国周利率变化的线性冋归 （2.45) 式的残差序列， （ a ) 时 间图； （ b ) 样本 ACF 

本节的主要任务是讨论一个简单方法来建立带时间序列误差的线性回归模型. 
这种方法是直接的.我们对残差序列选用一个本章所讨论过的简单时间序列模型， 
然后把整个模型联合估计出来.作为说明，考虑 (2.45) 式中的简单线性回归.因 
为模型的残差是序列相关的，所以我们给残差识别一个简单的 ARMA 模型.从图 
2-21 的样本 ACF 看出， MA(1) 模型对残差序列是适合的，把线性回归模型修改为 

C3t = « + Pcu + e. t , e t = a t — 0iat-u (2.46) 

其中 { a t } 是一个白噪声序列.换句话说，我们简单地用不带常数项的 MA (1) 模型 
来刻画 （2.45) 式中的误差项的序列相关性.结果得到的模型是带时间序列误差的 
线性回归模型的简单例子.在实际应用中，可把更复杂的时间序列模型加到线性回 
归方程上 i . 形成一般的带时间序列误差的回! d 模型. 

在现代计算机山现之前，估计带时间序列误差的回归模型不是件容易的事. 
人们提出一些特殊的方法，如 Cochrane-Orcutt 估 i | 量.来处理残差中的序列相关 
性（见 Gr e « i e (2000) 第546页).但现在这种估计与其他时间序列模型的估计一样 
容易.若所用的 N 间序列模型是平稳的、可逆的，则可用最大似然法把模型一起估 
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计 出来. 这就是我们应用 SCA 软件包所采用的 方法. 对美国的周利率数据.所拟 
合的形如 (2.46) 式的模型为 


c 3t = 0.00() 2 + 0.782 \ c. n + e t , e t = a t -f 0.211 5 a e _!, a a = 0.06 C 8, (2.47) 


其中 = 85.4%, 参数的标准误差分别为 0.001 8, 0.007 7和 0.022 1,此模型不再 
有显著的间隔为1的残差 ACF , 虽然在间隔为 4 和 6 时残差有较小的序列相关系 
数，但是，如果在残差方程中加上间隔为 4 和 G 的 MA 系数.结果的改进并不大, 
具体细节在此不作 W 论. 

比较 （2.44) 式、 (2.45) 式和 (2.47) 式这三个模型，我们观察到如下几点：第一， 
(2.44) 式的高和系数 0.924 会导致人们的错误认识，因为该模型的残差有强烈 
的序列相关性.第二，对利率变化置序列， (2.45) 式和 (2.47) 式 的妒和 r u 的系数 
都很接近，这说明对这个具体例子来说.对变化序列加上一个 MA (1) 模型得到的改 
进不大.这并不出人意料，因为估计出的 MA 系数尽管是高度统计显 著的. 但它+ 
是较大的数值.第三，上述分析表明在线性回归分析中检验残差的序列相关性很重 
要. 

因为 (2.47) 式中的常数项不显著，该模型表明前述两个周利率序列有如下关 
系： 

r-M =+ 0.782 ( ri < — + at 4- 0.212 a ，._ 卜 


这两种利率是相互影响并序列相关的. 

小结 

我们给出分析带时间序列误差的线性回归模型的一般 步骤： 

(1) 拟合一个线忡回归模型并检验其残差的序列相 关性； 

(2) 如果残差序列是单位根非平稳的.则对因变最和自变量都作一阶差分.然 
后对两个差分后的序列进行第 （1) 步若这时的残差序列是平稳的，则对残差识别 
—个 ARMA 模型并相应地修改线性回归模型. 

(3) 用最大似然法进行联合估计.并对模型进行检验看一看是否需要进一步改 
进. 

为检验残差的序列相关性，我们推荐使用 Ljung - Dox 统计量，而不是 Durbin - 
Watson ( DW ) 统计 M ， 囚为后者只考虑 间隔为 1的序列相关性.有时残差的序列相 
关性表现在高阶间隔上，尤其是在所涉及的时间序列呈现某种季节性的时候. 

注释：设有残差序列的 r 个观 察值. Durbin-Watson 统计量是 


DW = 


\Y 


直接计算表明 DW «2( l - p !), 其中呙是 { e t } 的间隔为 1 的 ACF . 
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在 S - Phis 中可以用命令 OLS (普通最小二乘）来分析带时间序列误差的回归 
模型，该命令假定残差服从 AR 模型. 为了识别延迟变量.可以用命令 tslag. 例如 
y = tslag(r,l). 下面给出了关于利率序列的相关命令，这里％表示对命令的 注释. 

□ 

> da=matrix(scan(file=* w-gsln362 99.txt 1 ),3) %load data 

> rlt=da[l,] 

> r3t-da[2 # ] 

> fit^OLS(r3t-rlt) % fit the first regression 

> summary(fit) 

> c3t=diff(r3t) % take difference 

> clt=diff(rlt) 

> fitl=OLS(c3t-clt) % fit second regression 

> summary(fit1) 

> f it2=OLS (c3t-clt-ftslag (c3t # 1) +tslag (clt, l) , na. rm=T) 

> summa ry(fi12) 

为得到更多的信息参见 2.10 节的输出结果. 


2.10 协方差矩阵的相合估计 


仍然岑虑 (2.43) 式给出回归模型.可能存在这样的 情形： 误差项^存在序列 
相关性或条件异力差性，然而我们分析的目标却是关于回归系数《和^做推断.对 
条件异方差性的讨论参见第：< 章.在系数的最小一乘估计仍然是相合估计的情形 
卜，巳经有方法给出系数协方差矩阵的相合估计，应用比较广泛的有两种方法.第 
—种方法称为异方差相合 ( HC ) 估计.参见 Eidc er ( l {)67) 和 White (1980). 第二种方 
法称为异方差及自相关相合 （ HAC ) 估计，参见 Newey 和 West (1987). 

为了容易讨论，我们将回归模型改写为 


y t = x[/3 + e t , i = 1, - • ,T, (2.48) 

其中％ 是因变量， 〜 , x kt y 是由包含常数项在内的自变量所构成的维 
向量，0 = (执， ••• ，汍) ' 是参数向量.这里 〆 表示向量 C 的转置 . 0的最小二乘估 
计以及与之相关的协方差矩阵的估计分别为 



- rp - 

-i T 

m T 


Yl xtx < 

^2x,y t , Cov (/9) = al 

t=l 

. t=i . 


其中4是 e , 的方差，可以用回归残差的方差来估计.当存在序列相关性或条件异 
方差性时，前面的协方差阵估计不再是相合的.这经常会导致卢的比偏大. 
Whitc (1980) 的估计是 


Cov(j9)hc 


t 




U : 


T 


T 


T 






T 

E 


t «Z/ fi 


(2.49) 
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其中6 = | 仍 - 是 （ 时刻的残差. Newey 和 West (1987) 给出的估计是 


其中 



m T m 

-1 

'T ' 

Cov(^)haC — 

^2 x i x 't 

C^HAC 



-t=l - 


-t=l . 

T 

i T 




(2.50) 


Chac = ^t x t x， t + 51^ 5Z { x te t et-jX [- j + x t -jet-jetx' t ), 

t=l j=l 


这里 / 是截断参数， & 是权重函数，例如它可以是如下定义的 Bartlett 权重函数 

3 


Ujj = 1 


/ + !' 


也可以用其他的权重 函数. Newey 和 West 建 议/取 4( T /100) 2 / 9 的整部.该估计本 
质上是用非参数的方法来估计 { EeiX t \ 的协方差阵. 

作为说明，我们在 (2.45) 式¥应用利率的一阶差分 序列. 如果忽略残差中的序 
列相关性和异方差性，则〜系数的比是 104.63; 如果用 HC 估计的话，该 /- 比 
变为 46.73; 如果用 HAC 估计，则该 比减少为 40.08. 下面我们用 S - Plus 来演示 
回归的过程.考虑到残差的序列相犬性，回归中用了延迟值和作为回 
归因子. 

S-Plus 演示 

%表示注释. 

> x=matrix(scan(file= / w-gsln36299.txt # ),3) % Load data 

> gsl=x[l,] % 1-year interest rate 

> gs3^x [2 # ] % 3-year interest rate 

> dgs3=diff(qs3) 

> dgsl=diff(gsl) 

> reg.fit=0LS(dgs3-dgsl) % Fit a simple linear regression 

> summary(reg.fit) 


Call ： 

OLS (formula 

=dgs3 - dgsl) 



Residuals : 

Min 

IQ Median 

3Q 

Max 


-0.3806 -0. 

Coefficients 

0334 -0.0005 

0.0344 

0.4742 



Value Std. 

Error 

t value 

Pr(>|t|) 

(Intercept) 

0.0002 0. 

0015 

0.1609 

0.8722 

dgsl 

0.7811 0. 

0075 

104.6283 

0.0000 


Regression Diagnostics : 
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R-Squared 0.8479 
Adjusted R-Squared 0.8478 
Durbin-Watson Stat 1.6158 

> Bummary (reg. f it # corrections 11 white" ) % Use HC estimator 
Cocfficienta : 

Value Std. Error t value Pr(>|t|) 

(Intercept) 0.0002 0.0015 0.1609 0.8722 

dgal 0.7811 0.0167 46.7260 0.0000 

> summary(reg.fit,correction="nw") % Use HAC estimator 
Coefficients : 

Value Std. Error t value Pr(>|t|) 

(Intercept) 0.0002 0.0017 0.1436 0.8858 

dgsl 0.7811 0.0195 40.0041 0.0000 

% Below, fit a regression model with time series error 

> reg.ts=OLS(dgs3-dgsl+tslag(dgsi # 1)+tslag(dgsl # 1),na•rm=T) 

> summary(reg.ts) 

Call ： 

OLS(formula « dgs3-dgsi-t-cslag (dgs3 # l) -ftalag (dgol r 1) , na. nn = T) 


Residuals : 

Min IQ Median 3Q Max 

-0.3652 -0.0329 -0.0005 0.0333 0.4506 

Coefficients : 

value std. Error t value Pr(>|t|) 


(Intercept) 0.0002 

0.0015 

0.142G 

0.88G6 

dgsl 0.7851 

0.0078 

100.4694 

0.0000 

tslag(dgs3, 1) 0,1920 

0.0221 

8.6685 

0.0000 

tslag(dgsl # 1) -0.1634 

Regression Diagnostics : 

R-Squared C.8537 
Adjusted R-Squared 0.8535 
Durbin-Watson Stat 1.9740 

0.0190 

•8.6219 

0.0000 


2.11 长记忆模型 


我们已经讨论过.平稳序列的 ACF 在间隔增加时呈指数速度衰减.但是，对 
单位根非平稳时间序列.可以 证明： 对任意固定的间隔，当样本容量增加时.样本 
ACF 收敛于 1( 见 Chan 和 Wei (1988) 以及 Tiao 和 Tsay (1983)). 有些时间序列的 
ACF 随间隔的增加以多项式的速度缓慢衰减到0,这样的过程称为长记忆时间序 
列长记忆序列的一个例子就是如下定义的分数差分 序列： 


(1 — B) d xt = at , —0.5 < d < 0.5, 


(2.51) 
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其中沁是一个白噪声序列.模型 (2.51) 的性质已在文献中得到广泛的研究（如 
Hosking (1981)). 我们把它的一些性质综述如下. 

(1) 若 d < 0.5,则: r t 是弱平稳过程并有无穷阶 MA 表示： 

OO 

Xf = ^ , 

i=l 

其中 

d (1 + d) • • • (fc — 1 + d) (/r 十 d 一 1)! 

Vk = k \ = A :!( d -1)! • 

(2) 若 d > -0.5, W \ x t 是可逆的并有无穷阶 AH 表示： 

OO 

= > : 兀 i 工 t—i + at ， 


其中 


-d (1 - d) ••• (Jt - U) (A ： - d - 1)! 

~T\ = k\{-d- 1)!* 


(3) 对 一 0.5 < rf < 0.5, & 的 ACF 为 

d (1 + rf ) • • • (fe - 1 + rf ) 

Pk= (1- d )(2- d )..-( fc - d ) 

特别地 .A — d / (1 - d ), 且当 fc -» oo 时 


k = 1 ， 2, • • • • 


Pk ^ 


(― 岣！ ,.2d-i 


(d-l)! 




(4) 对 -0.5 < d < 0.5, x t 的偏自相关函数 （ PACF ) 为 = d / (k - d ), 

A * = 1 ，2,… • 

(5) 对 —0.5 < d < 0.5, 的谱密度函数 / ( u ;)( 它是: r t 的 ACF 的傅里叶变换) 

满足 

f { uj ) ~ uj ~ 2d , w -* 0, (2.52) 

其中 a； e [0, 2 n \ 表不频率. 

当 rf < 0.5 时，我们对: r , 的 ACF 的性质特别感兴趣.这条性质表明外〜 
ck 2 ' 卜、 以多项式速度衰减，而不以指数速度衰减.正因为这个原因，这样的 j •，过 
程称为长记忆时间序列. (2.52) 式中谱密度的特殊特征是当 u ; — 0时谱发散到无 
穷，而平稳 ARMA 过程的谱密度函数对 a ; e [0,2^] 是有界的. 

前面我们用到了非整数幂的二项式 展开： 


fc 二0 




(d \ d(ci — l)."(c/ — 十 1) 

uj = — ^ — 
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若分数差分序列 （1 - B ) d x x 服从一个 ARMA(p ， y) 模型. 则称心 为一个 ARFIMA 
{ p , d , g) 过程，它是 ARIMA 模型的推广，这里允许 d 为非整数. 

在实际中.如果 ■•个 时间序列的样本 ACF 在数值上不大，但衰减得很慢，则该 
序列就可能会有长记忆性.作为说明，图 2-22 所示的是 1962 年 7 月 3 日至 1997 
年 12 月 31 日的 CRSP 价值加权指数和等权重指数的日简单收益率的绝对值序列 
的样本 ACF 值.可见 ACF 的数值相对较小，但衰减很慢.甚至在间隔为 300 以后 
还在 5% 的水平下是显著的.对绝对值收益率序列的样本 ACF 的表现.更多的讨论 


(») 



间阱 


图 2-22 CRSP 价值加权指数和等权重指数的日简单收益率的绝对值序列的样本 ACF ： 
( a ) 价值加权指数收益率的绝对值序列的 ACF ; ( b ) 等权重指数收益率的绝对值序 
列的 ACF . 时间区间是从1962年7月3日到1997年12月31日 

参见 Ding , Granger 和 Engle (1993) .对 (2.51) 式中的纯分数差分模型，我们可以用 
最人似然法或带低频对数周期图的回归方法米估计 rf . 长记忆模型在金融文献中受 
到关注，邰分的原因是在连续时间模型中关十分形布朗运动的工作. 


附录一些 SCA 的命令 

2.4 节中使用的命令 

数据文件是 m - vw . txt , 符号“一”后为注释，这些注释解释的是每个命令的功 
用. 

— load data into SCA and denote the series by vw. 
input, vw. file # m-vw . txt 9 
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--compute 10 lags of PACF. 
pacf vw. maxi 10. 

— compute AIC for AR (1) to AR(10) . 
miden vw. no ccm. arfits 1 to 10. 

--specify an AR(3) nodel and denote the model by ml. 
tsm ml. model (1,2,3) vw^cO-f noise. 

— estimate the model and store the residuals in rl. 
estim ml. hold resi(rl) 

--cutnpuLe ACF ol Lhe xeuidudlti , including Q tjLdL 丄 tilics, 
acf rl, 

― refine the model to an AR(B). 
tsm ml. model (1 # 2,3,4 # 5) vw=cO*fnoise . 

- eatimate the model ajid store the reoidualo in rl. 

estim ml. hold resi(rl) 

--compute ACF of the residuals. 
acf rl. maxi 10. 

• compute p value of the Q(5) statistic. 
p=1.0-cdfc(11.2,5) 

― print p-value. 
print p 

—— re-estimate the nodel using the first 8B8 observations. 
estim ml. span 1,858. 

•- compute 1-step to 6 - step ahead forecasts at origin 858. 
ufore mi. orig 858, nofs 6. 

-• quit SCA. 
stop 


2.9 节中使用的命令 

一年期限利率在文件 “ wgslyr . txt ” 中.三年期利率在文件 “ W gs 3 yr . txt ” 中. 


― load data into SCA, denote the data by ratel and rate3. 
input date, ratel. file # wgslyr.txt # 

input date,rate3. file r wgs3yr.txt # 

specify a simple linear regression model. 
tsm ml. model rate3‘b0 十 （ bl)ratel+noise. 

--estimate the specified model and store residual in rl• 

estim ml. hold resi(rl). 

― compute 10 lags of residual acf. 
acf rl. maxi 10• 

- -difft:hf» series & denote the new ones by clt and c3t 
diff old ratel,rate3• new clt, c3t. compress. 

--specify a linear regression model for the differenced data 
tsm m2. model c3t=h0 十 <hl)clt+noise• 

--estimation 

estim m2, hold resi(r2). 

—— compute residual acf. 


acf r2. maxi 10• 
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― specify a regression model with time series errors. 
tsm m3. model c3t=g0+(yl)clL+(1)noise. 

--estimate t.hp mo^el using the exact likelihood method, 
estim m3, method exact. hold resi(r3). 

--compute residual acf. 
dcf r3. maxi 10. 

--refine the model to include more MA lags, 
tsm m4• model c3t=g0+<gl)clt+(1,4,6>noise• 

--estimation 

estim m4. method exact. hold resi(r4)• 

一 compute residual acf. 
acf r4. maxi 10. 

•- exit SCA 
stop 

练习题 

除非特别声明，在以下习题中都用5%的显著性水平来得出结论. 

2.1 假定一个愤券指数的月简单收益率服从如下 MA (1) 模型： 

Rt = o.t + CK2at—I, = 0.025. 

假设 a 100 = 0.01. 计算该收益率以 4 = 100 为预测原点的向前丨步和向前2歩的预测. 
预测误差的标准差分别是多少？计箅该收益率序列的间隔为〖和间隔为 2 的 ft 相关系数. 
2.2 假定一个证券的日对数收益率服从棹细 


r t = ().01 十 t).2rt 一 2 十 

其中 { at } 是均值为0、方差为 0.02 的高斯白噪声序列.收益率序列的均值和方差 
是多少？计算 G 的间隔为1和间隔为2的自相关系数.假设7* 100 = -0.01, r 99 = 0.02 
计算该收益率序列以 f = 100为预测原点的向前1步和向前 ‘2步的预测.预测误差的标 
准差分别是多少？ 

2.3 考®美国从1951年1月到 2 UU 4 %- 2月的月失业串，数据包含在文件‘ *m-unemhelp.txt* » 
屮.数据已经经过季节调整.来自圣.路易斯联邦储备银行.为该序列建立一个时间序列 
模型，并用该模锻预测2004年3月、4闩和5月的失业丰.进-步，如果存在周期环，计 
算其周期.（注意，适合该数据的模型不只一个，只要模型是充分的即可 .） 

2.4 考虑基于市场资本化的纽约证券交舄所、美国证券交易所和纳斯达克证券交易所中 Decile 
1 ， Decile 5和 Decile 10的简中月收益宇.数据的时间区间是从 19 G 0 年1月到2003年 
12月.数据来自 CRSP 

( a ) 对每个收益序列.在5%的显著性水平下检验如下原假设 ：前〗 2个间隔的自相关系 
数全为0,并得出结论. 

( b ) 为 Decile 5序列建立 AR 模型和 MA 模型. 

( c ) 用所建立的 AR 模型和 MA 模型对序列进行向前1步到向前3步预测. 

2.5 考虑 IBM 股票从1962年到2002年的日 简申收 益率.数据包含在文件‘ ‘d-ibmvwevj6202. 
txt" 中.计算 IBM 股票日简单收益率绝对值序列的前1(】0个间隔的样本 ACF . 存在长 
范围相依的证据吗？为什么？ 
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2-6 考虑美国制造业的用电需求.数据是取对数后的.表示每个月中阆定某天的需求，包含在 
数据文件 ‘‘power6.txt ， •中.对序列建立时间序列模型，并用所拟合的模型进行向前 1 
步到向前 ‘24步预测. 

2.7 再考虑 CRSP 等权 I 指数（包含分布）从1 98 ()年1月到1999年12月的日简单收益率, 
数据包含在 文件* * d - ew 8099. txt **4 , . 代表星期、星期二、星期三和星期四的指示变鼠 
介储在 文件‘ 、 kday 3 8 0 9 9. txt ’ * 的前四列.用-•个回归模型来研究指数收益率的交易日 
效〗、 V ..所拟合的模型足什么？对于该序列，周末效放在5%的显着性水肀著吗？用协方 
差阵的 HAC 估米 H 算归估 i | 的〜比.这会改变周木效应检验的结论吟？残差中存 
在序 列相欠 性吗？如来存在序列相关性，建立带时间序列误差的模型来研究周末效应. 

2-8 由上一个练习知节权重指数的 R 收益率存在 些 周末效应，那么 S & P 500 综合指数存在 
周末效应吗？为冋答该 H 题，考虑从2000 年丨月 3日到2003年12月31日的 S & P 5 ⑻ 
综合指数的日收益宰，数据包含在文件 “ d - dall ：? dx 0003. txt ” 中，该文件有12列.前四 
列分别是 Dell ， vw , ew . 和 S p 的日收益率，第5〜9列分别是周一到周五的指示变量第 
10-12 列分别表示年、月、日.共有1 ()04 个数 据点. 所有的检验都在5%的显著性水平 
下进行，回答下述 问题： 

( a ) S & rP 50 n 综合指数的日简单收益率存在星期五效应吗？你可以用一个简单的线性回旳 
模型来回答该 H 题.估计模型，并检验不存在甩期五效应的原假设.得出你的结论. 

(b) 用 Q(12) 统计量来检验残差的序列相关性.残差中存在显著的序列相关性吗？ 

2 9对单个股票收益率考虑与上题中类似的问题.在该题中，我们采用 Dell 股票的日简单收益 
率. 

( a ) Dell 股票的日简单收益率存在星期五效应吗？估计模型，并检验不存在星期五效应的 
原假设，得出你的结论. 

( M 残差中存在序列相关性吗？用 Q (12) 统计最进行检验，并得出你的结论. 

( C ) 用带时间序列误差的回！ d 模型对上述模型进行改进.基于改进后的模型，存在显著的 
星期五效应吗？ 

2-10 考虑穆迪公司发售的 AAA 和 BAA 优质债券从1919年1月到2004年3月的毎月盈 
利. 数据来自圣.路易斯联邦储备银行.月盈利是日盈利的平均值.计算这两个收益举序 
列的概括性统计贵（样本均倌，样本标准差.样本斜度.样本超额峄度，最大值、敁小值). 
债券盈利是偏斜的吗？它们是厚尾的吗？在5%的显著忡水平下冋答这些问题 
2.11 考虑练习 2.10 中的 AAA 债券月盈利，为该序列建立一个时间序列樽彻. 

2.12 仍然考虑两个债券序列 ， Ba AAA 和 BAA . 这两个序列之间有什么关系？为回答该问题. 

把 AAA 债券的盈利作为因变量.而 BAA 债券的盈利作为自变量来建立时间序列模型. 
2.13 考虑 CRSr » 等权重指数的月对数收益丰.从 1962 年 1 月到 1999 年 12 月共 45(5 个观察 
值. 你可以 M 接从 CR.SP 或在网 ]： 文件 "m-ew6299.txt ••中得到数据. 

( a ) 给该序列建立-个 Aft 模型，并检验所拟合的模型. 

( b ) 给该序列建立一个 MA 模型，并检验所拟合的模型. 

( c ) 用前两问中所建的 AR 和 MA 模型计算向前1步和2步预测. 

( d ) 比较所拟合的 AR 和 MA 模型. 

2.14 考虑 S&P500 指数的现价与期货价的动态： X ： 系•数据文件 ‘‘sp5may.dat ，， 有 三列： 期货 
价的 对数. 现价的对数和交易成本 (cost-of-carry)(x 100). 数据是来自芝加 fif 商姑交易所 
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(Chicago Mercantilf Rxchmigp ) 的 1 即 3 年5月的 S & P 500 指数及其 （} 月的期货合约. 
时间间隔为1分钟（一天内).有些作者利用此数据来研究指数期 货的奄 利机会这里我们 
把注意力放在前两列上.设 / t 和〜分别是期货价和现价的对数.考虑少-，和 
A = 如一& 4，设 y t 为因变量，建立 { y ,} 和 {〜} 间带时间序列误差的冋归模型. 

2.15 每季度国民生产总值的隐性通货紧缩抱数 (gross domestic product implicit price defla ¬ 
tor ) 通常用宋度最通货膨胀.文件 “ q-gdpdef . dat " 包含了美国从1947年第一季度到 
2004年第一季度的此数据.数据格式是年、月和通货紧缩指数.该数据是经过季节性调整 
的， 2000年时的数值为 Ul () . 对该序列建立-‘个 ARIMA 模型，并检验所拟合的模型的有 
效性.数据是从蚤 • 路易斯联邦储备银仃得到的. 
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第 3 章条件异方差模型 

本章的日标是研究一些在文献中用来给资产收益率的波动率建模的统计方法 
和计量经济模型.称这些模型为条件异方差模型. 

波动率在期权交易中是一个重要因素，它是标的资产收益率的条件标准差.例 
如，考虑一个欧式看涨期权的价格.欧式看涨期权是一个合同，它给持有者一个权 
利，可以在将米给定日期以固定的价格购买固定数景的一个具体股票的股份.持 
有者在对自己不利的情况可以不执行购买.这个固定的价格叫做敲定价格 (strike 
price), 通常记为给定的日期叫做到期日.这里重要的是距离到期日的时间长 
度，记为 /. 著名的 Black-Sdioles 期权定价公式表明一个欧式看涨期权的价格是 

c t — (a:) - Kr~ 1 ^ - <r t VPj , x = ^ 、 + ^a t V7, (3.1) 

其中 P , 是标的股票的现价, r 是无风险利率， a t 是该股票对数收益率的条件标准 
差， 4»( x ) 是标准正态随机变量的累积分布函数在 x 点的值.此公式的推导将在第 
6章给出.对这个公式有几个精彩的解释，但在这里只要明白标的资产对数收益率 
的条件标准差^在其中起重要作用这一点就够了.这个波动率随时间变化，并且 
将是本章主要讨论的问题.如果持有人能在到期日或者在到期日之前任何时刻执行 
他的权利，那么这种期权叫做美式看涨期权. 

波动率在许多其他金融方面也有应用.如第 7 章的讨论，波动率的建模提供了 
一个简单方法来计算风险管理中一个金融头寸的风险值.对于均值方差框架下的 
资产配置. 波动率也起了重要作用进一步，一个时间序列波动宇的建模能改进参 
数估计的有效性和区间预测的精确度.最后，市场的波动率指数最近已经成为一种 
金融1 •具. 由芝加哥期权交易所 (Chicago Board of Option Exchange , CDOE ) 编制 
的 VIX 波动率指数已经于 2004 年 3 月 26 日进行期货交易. 

本章讨论的一元波动率模型包括 Engle(1982) 提出的自回归条件异方差 （ au¬ 
toregressive conditional hetcroscedastic, ARCH) 模型， Bollerslev(1986) 提出的推 
广的自回归条件异方差模型 （ GARCH) ， Nelsou(1991) 提出的指数 (JAHCH 模型 
(EGARCH), Tsay(1987) 提出的条件异方差自回归滑动平均 （ CHARMA) 模型， 
Nicholls 和 Quinn (1982) 提出的随机系数自回归 （ RCA) 模型， Melino 和 Turn- 
bull(1990), Taylor(1994), Harvey, Ruiz 和 Shephard(1994), 以及 Jacquier, Poison 和 
Rossi(1994) 分别提出的随机波动率 (Stochastic Volatility, SV) 模型.我们还讨论了 
各个波动率模型的优点和缺点，并给出这些模型的一些应用.多元波动率模型，包 
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括那些具有时变相关系数的模型.将在第10章中讨论.本章还在 3.15 节讨论了波 
动率建模的一胜其他方法.包括应用某项资产的最高价格和最低价格. 

3.1 波动率的特征 

股栗波动率的一个特殊性是它不能被直接 观测. 例如.考虑 LBM 股票的日对 
数收益率.因为一个交易日只有一个观测值，所以日波动率不能从收益率中观测出 
来.如果可以得到•天内的股票数据，如 1() 分钟的收益率.那么我们可估计日波动 
率，参见 3.15 节.然而这种估计的准确性值得仃细研究.例如，股栗波动率包括交 
易曰内波动率和隔夜波动率，而后者代表不同交易日之间的变化.高频交易曰内收 
益率只包含隔夜波动率很有限的信息.波动率的不可观测性给评价条件异方差模型 
的预测表现带来了困难.我们将在后面章廿中讨论这一问题. 

在期权市场上,如果我们接受这样一个 思想： 期权的价格是由如 Black-Scholes 
公式这样的计量经济模型决定的，那么我们就可以利用期权的价格得到隐含波动率 
(implied volatility). 这种方法往往遭到批评，因为使用的具体模型，要基于一些实 
际可能不成立的假定.例如.由一个欧式看涨期权的价格，我们能利用 (3.1) 式的 
Black-Scholes 公式推导出条件标准差所得到的值称为标的股票的隐含波 动率. 
然而，这个隐含波动率是在假定标的资产的价格服从几何布朗运动时得到的，它可 
能与实际的波动率很不一样.经验告诉我们，隐含波动率一般要比采用 GARCH 类 
波动率模型得到的值大.这也许是与波动率的风险溢价或计算日收益率的方法有 
关.芝加哥期权交易所的 VIX 波动率指数是隐含波动率指数. 

虽然波动率不可直接观测，但它的一些特征在资产收益率序列中能普遍看到. 
第一 . 存在波动率聚集 （volatility cluster ), 也就是，波动宇 .可 能是在一些时间段 
上高，而在另一些时间段上低.第二，波动率以连续方式随时间变化，即波动率跳跃 
是很少见的.第二，波动率不发散到无穷，即波动率在固定的范围内变化.从统计 
学角度说，这意味着波动率往往是平稳的.第四，波动率对价格大幅上丌和价格大 
幅下降的反应不同，这种现象称为杠杆效应 (leverage effect ). 这些性质对波动率 
模型的发展起着重要作用.一些波动率模型 主要具 体针刘已有模型在刻画上述这 
些特征上的弱点而提出的.例如， ECAKCH 模型就是为了刻画波动率对大的“正” 
和“负”资产收益率的不对称性而提出来的. 

3.2 模型的结构 

用 n 表示某项资产在 < 时刻的对数收益率.波动率研究的基本思想是，序列 
{ r ,} 是序列不相关的或低阶序列相关的，但不是独立的.作为说明，图 3 -1 给出了 
Intel 公司股票从1973年1月到2003年12月的月对数收益率的自相关函数 ( ACF ) 
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和偏自相关函数 （ PACF ). 图 3- la 是收益率的样本 ACF . 显示除了在滞后为7时有 
较小相关性之外没有显著的序列相关性.图 3- k 是对数收益率的绝对值序列 | n | 
的样本 ACF , 而图 3- ih 是收益率平方 rf 的样本 ACF , 这两幅图清楚地表明月收 
益率序列不是独立的.结合上述三个图形，收益率序列看起来像是序列不相关的且 
不是独立的.波动率模型就试图去刻画收益率序列的这种不独立性. 
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图 3 -i Intel 公司股票从1973年 1 月到2003年12月的月对数收益率的样本自相关函数和 


样本偏 ft 相关函数： （ a ) 对数收益率的样本 ACF ; ( b ) 收益率平方 r ? 的 ACF ; ( c ) 对 
数收益宰-的绝对值序列 | r t | 的样本 ACF , ( d ) 收益串 T 方的 PACF 


为了把波动率模型放在一个合理的框架中，考虑给定 t - 1时刻已知的信息集 
巧 ^时的条件均值和条件方差 

/z t = E (r t of = Var (r t ) = E [(r, - ht ) 2 (3.2) 


是有益的.特别地，信息集包含过去收益率的一切线性函数.第2章中的实 
例和图 3*1 表明： 股票收益率序列 n 即使有序列相关性的话也很弱.因此 （3.2) 式 
中关于 A 的等式应是较简单的，我们假定 r t 服从一个简单的时间序列模型，如带 
解释变量的平稳 ARMA ( p , q ) 模型.换句话说.对于我们接受模型 

k p q 

== /if + (It , fit = (f>Q + > : + > : t 一 i — 〉: Oidt 一 “ (3.3) 

i=l »=1 i=l 

其中可 fc ， p 和 g 是非负整数 .: r it 是解释变量. 

模型 (3.3) 给出了第2章中线性时间序列模型在金融中的可能应用. ARMA 
模型的阶 ( p , <{) 可能取决于收益率序列的频率.例如.股票市场指数的日收益率往 
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往有较小的序列相关性，但指数月收益率可能就没有任何显著的序列相关性.模型 
(3.3) 中的解释变量〜比较灵活.例如对星期一这天设计一个 “哑变量” (dummy 
variable ) 来研究股票日收益率的周 末效应 (the effect of weekend ). 在资本资产 
定价模型 （ CAPM ) 中， n 的均值方程可以写为 r t = <l>o + l3r m ,t + a t , 其中 r m . t 代表 
市场组合的收益率. 

结合 (3.2) 式和 （3.3) 式,我们有 

o} = Vai (r't |F t _i) = Var (a t ). (3.4) 

本章的条件异方差模型就是用来描述 d 的演变的 . W 随时间变化的方式可以用 
不同的波动率模型来表示. 

条件异方差模型可分为 两类： 第一类是用确定的函数来刻画4的 演变； 第二 
类是用随机方程来描述 GARCH 模型属子第一类，而随机波动率模型属于第 
二类. 

本书把称为资产收益率在 i 时刻的 “扰 动”或 ••新 息 ”，^为 a t 2 的正平方 
根. (3.3) 式中~的模型称为 r t 的均值方程，4的模型称为 r t 的波动率方程.因 
此.条件异方差性建模就是对时间序列模型增加个动态方程，来刻画资产收益率 
的条件方差随时间的演变规律. 

3.3 建 模 

对资产收益率序列建立一个波动率模型需要如下 4 个步骤. 

(1) 通过检验数据的序列相关性建立一个均值方程，如有必要，对收益率序列 
建立一个计量经济模型（如 ARMA 模型）来消除任何的线性依赖. 

(2) 对均值方程的残差进行 ARCH 效应 检验. 

(3) 如果 ARCH 效应在统计上是显著的，则指定一个波动率模型.并对均值方 
程和波动率方程进行联合估计. 

(4) 仔细地检验所拟合的模型.如有必要则对其进行改进. 

对大部分资产收益率序列，如果有序列相关性的话，也很弱.因此，如果样本均 
值显著的不为零的话，建立均值方程就等于从数据中移除样本均值.对于某些日收 
益率序列，建立一个简单的 AR 模型是必要的.在某些情形下，均值方程可能要用 
到解释变量，比如为解释周末效应或一月效应而引进的指示变量. 

在下文中，实证分析用的软件是 S-Plus. 其他的一些的软件包也可能用到.例 
如 E views, SC A，R 以及 RATS 等. 

ARCH 故应的检验 

为了符号上的方便， id a t = r t - M t 为均值方程的残差，则可以用平方序列# 
来检验条件异方差性，即所谓的 ARCH 效应.有两个检验可以用.第一个检验是将 
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通常的 Ljurig - Dox 统计 M { Q ( m )} 应用于序列 { a ^}, 参见 Mcleod 和 Li (1983) •该 
检验的原假设是 {«?} 序列前 m 个间隔的 ACF 值都为零.笫二个对条件异方差的 
检验是 Engle (1982) 的拉格朗日乘子 检验. 该检验等价于在如下线性回归中用 F 
统计量检验 Ofi = 0 (i = 1，…， m ): 

af = o?o 4 - ( if^i + ... + rn + p . t , / = m + 1,... , T , 

其中 e < 表示误差项， m 是事先指定的正整数， r 是样本容量.具体地，原假设是 
Ho : «i = ••- = a m = 0•令 SSRo = Z ) ( a ?- 功 2 ,其中 D = (1/ T 1 ) X ] aj ? 是 a'f 

t=m-f 1 t=l 

的样本均值，并且 SSRx = E el 其中& 是前面线性回归最小二乘估计的残差. 

t=m 十 1 

于是在原假设下，我们有 

(SSRo - SSRi)/m 
= SSRi /( T - 2 m - l )' 

它渐近服从自由度为 m 的 x 2 分布.决策规 则是： 如果 F > Xm («) 或 F 的 p 值小 
于《，则拒绝原假设.这里 X ^(«) 是 Xl 的上 100(1- a ) 分位点. 

为通过例子说明上述理论，下面考虑 Intel 公司股票从1973年到2003年的月 
对数收益率，参见下面的例 3.1. 序列没有显著的序列相关性，因此可以直接来检验 
ARCH 效应.事实上，序列的 Q ( m ) 统计量给出 Q (12) = 18.57, p 值为 0.10, 进一 
步确认了数据没有序列相关性.另一方面，拉格朗日乘子检验给出检验统计量值为 
43.5, v 值靠近零，这表明有很强的 ARCH 效应. 

S-Plus 演示 

将收益率序列记为 intc . 注意到命令 archTesI : 直接应用于序列 tt t , 而不是 

> autocorTest(into,lag-12) 

Test for Autocorrelation ： Ljung-Box 
Null Hypothesis : no autocorrelation 

Teat Statistics : 

Test Stat lfi.5664 p.val ur 0.0995 

Dist. under Null : chi-square with 12 degrees of freedom 
Total Observ .； 372 

> archTest(intc, lag=12) 

Test for ARCH Ettects ： LM Test 
Null Hypothesis: no ARCH effects 

Test Statistics : 

Test StaL 43.5041 p.value 0.0000 

Dist . under Null ： chi-square with 12 degrees of freedom 
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3.4 ARCH 模型 


给波动率建模提供一个系统框架的第一个模彻是 Engle (1982) 提出的 ARCH 
模型. ARCH 模型的基木思想是： （ a ) 资产收益率的扰动是序列不相关的，但不 
是独 立的； （ b ) 的不独立性可以用其延迟值的简单二次函数来描述具体地说，一 
个 ARCH ( m ) 模型是假定 

at = cr t £ t , a'f = a 0 4 - aia^_j -f • • • + a m a ' f _ Tn , (3.5) 

其中是均值为0、方差为 1 的独立同分布 （ iid ) 随机变童序列，> ()，对/ > 0 
有 a , > 0. 系数％ 必须满足一些正则性条件以保证 A 的无条件方差是有限的.实 
际中，通常假定&服从标准正态分布.标准化的学生分布，或广义误差分布. 

从模型的结构上看，大的过去的平方“扰动” { af _,}^ 1 会导致新息的大的 
条件方差 af . 从而，有取绝对值较大的值的倾向.这意杂着，在 ARCH 的框架下, 
大的“扰动”会倾向于紧接着出现另一个大的“扰动”.这里用•、倾向”这个词，是 
因为大的方差不一定意味着大的实现值，它只表明是大方差发生的概率比小方差情 
形要大.这与在资产收益率中所观察到的“波动率聚集 ” (Volatility cluslerins ) 现象 
相似. 

ARCH 效应也出现在其他金融时间序列中.阁 3-2 a 显示了 1989年 G 月5 
日至1989年6月〗9 F 1 每10分钟间隔观察的德国马克对美元的汇率的百分比 
变化量的时间图 3-2 b 显示的是这个百分比变化量的平方所构成的序列的时间图. 
变化 M 的大的百分比时有发生.但存在某种稳定的周期.图 3-3 a 显示的是这个百 
分比变化量序列的样本自相关函数.它淸楚地表明该序列没有序列相关性.图 3-3 b 


( a ) 汇率中的百分比变化 




图 3-2 ( a ) 1989年6月5日至1989年6月19日每10分钟间隔的 

德国马克对美元汇率的收益率； （ b ) 该收益率的平方 
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0 . 1 () 
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问隔 

图 ( h ) 德国马克对美元的汇率收益率序列的枰本自相关函数： 

(b) 平方收益串序列的样本偏自相关函数 

是变化量的百分比序列的平方所构成的序列的样本偏自相关函数，可见这个函数有 
一些大的值，这表明该序列不是独立的，并且有所谓的 ARCH 效应. 

注释有些作者把 (3 5) 式中的条件方差表示为这时“扰动”变成 at = 

□ 

3.4.1 ARCH 模型的性质 

为了理解 ARCII 模型的含义.我们来仔细研究一下 ARCH ( l ) 模型： 

at = crt£t, of = c»o + 

其中勿 > 0, a , ^ 0. 首先， a , 的无条件均值仍是0,因为 

E ( a t ) = E[E ( a t | F,_,)]-E [ a t E ( e *)] = 0. 

其次， a , 的无条件方差是 

Var (at) = E («^) = E [E (a? |-F ( _ j ) j = E [a。+ j] — «o -h aiE (u.D . 

因为〜 是平稳过程旦 E 二 0, 所以 Var(a t ) = Var(a t _,) = 从而.我 

们有 Var («. £ ) = ^ v u + o ^ Var ( at ), 即 Var ( o . ( ) ^ . 因为 的方差必须为正的, 

1 — QT1 

我们需要条件0 $叫< 1. 最后，在一些应用中，我们需要 a , 更卨阶的矩存在，从 
而… 还需满足另外的约泶 条件. 例如，为研究 a t 的尾部性质，我们要求的四阶 
矩始有限的.在 (3.5) 式中假定 q 服从正态分布，则有 

E ( a ? )^3 [E ( a ? H )] 2 = 3 (« 0 + a ia 2_,) 2 . 




因此 
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E ( af ) = E [E ( a / |^- 1 )] = 3 E ( tt 0 4- i ) 2 = 3E [ a o + 2 a 0 aia?_i + c^aU • 


若〜是四阶平稳的且 id m 4 = E (af), 则我们有 

m 4 = 3 [a^ + 2a 0 tt,Var(a t ) + afm 4 ] = 3o^ (1 + 2 --^^ J f 3a'fm 4 . 

从而 

3ag(l+ai) 

(1 - qi) (1 - 3af) * 

这个结果有两个重要含义 ：（a) 因为 a, 的四阶矩是正的.所以叫必须满足 1-3*^ > 
0,即0 < < ^; (b) a t 的无条件峰度是 

E ( a t) = o Q^U+Qii) (1 - Qi) 2 _ ,) 1 - 

[Var (a<)] 2 (1 — ai) (1 — 3af) 1 — 3af 

这样， a t 的超额峰度是正的，并且 a< 的分布的尾部比正态分布的尾部要厚.换句 
话说，服从条件高斯的 ARCH(l) 模型的“扰动” rz t 比高斯白噪声序列更容易产生 
“异常值” (outliers), 这与实证结果相 一致. 实证结果也表明资产收益率中出现‘‘异 
常值”的时候要比独立同分布的正态随机变量序列出现“异常值”的时候多. 

这些性质对一般的 ARCH 模型仍成立，但对高阶 ARCII 模型公式会变得更复 
杂 一些. (3.5) 式中条件能放松，这是一个保证条件方差 a t 2 对所有的 f 取正 
值的条件.事实上，使条件方差取正值的一个自然方式是把 ARCII(m ) 模型改写成 


a t = O t £t, of = IXQ + (3.6) 

其中 ^m,t 1 = ( rt < l , ••- ,a t — m )'， n 是一个 m x rn 阶的非负定矩砰 • (3.5) 式定义 
的 ARCH(m) 模型要求是对角阵.这样， Engle 的模型是用一个非常节省参数的 
方式来逼近一个二次函数.实现 (3.6) 式的一个简单方法是给叫一个随机系数模 
型，具体可参见后面章节讨论的 CIIARMA 模型和 RGA 模型. 

3.4.2 ARCH 模型的缺点 

ARCH 模型有不少优点.包括前一节中讨论的性质.该模型也有一些缺点. 

(1) ARCH 模型假定正的“扰动”和负的“扰动”对波动率有相同的影响，因为 
波动率依赖于过去“扰动”的平方.实际中，众所周知，金融资产的价格对正的和负 
的“扰动”的反应是不同的. 

(2) ARCH 模型对参数的限制相 当强. 比如,若序列有有限的四阶矩，则 ARCH ⑴ 
中的4必须在区间 [0，d 中. 对高阶的 ARCH 模型，这种约束会变得更复杂.在 
实际中，这就限制了带高斯新息的 ARCH 模型更好地刻画超额峰度. 
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(3) 对于弄清一个金融时间序列的变化的来源， ARCH 模型不能提供任何新见 
解. 它只是提供一个机械的方式来描述条件力差的行为.而对由什么引起这种行为 
却没有给出任何启示. 

(4) ARCH 模型给出的波动率预报值会偏高，因为它对收益率序列大的孤立的 
“扰动”反应缓慢. 


3.4.3 ARCH 模型的建立 

在所有的波动率模型中，建立个 ARCH 模型相对来说是比较简单的.下面 
给出其建模的细节. 

阶的确定 

如果通过检验发现存在显著的 ARCH 效应，则可以用 a ? 的偏自相关函数 
( PACF ) 来确定 ARCH 模型的阶.下面我们来说明用4的 PACF 来选择 ARCH 
模型的阶是合理的.从 （3.5) 式定义的模型出发，我们有 

of = a 。 + aia^_ 1 + …+ a m af_ m . 

对给定的样本，< 是4的无偏估计.囚此，我们期望 < 以 m 阶自回归模型的方 
式与# 线性相关.注意到单个的 < 往往不是疗的有效估计，但它口 J 

以作为一个近似.在具体确定阶 m 时这个近似将会提供充分的信息. 

从另一角度，定义 r , t = a ^- af . 那么可以证明{%}是均值为零的不相关序列. 
于是 ARCH 模型变成 


这是4的 AR ( m ) 形式，但不是独立同分布的序列.由第2章的内容，4的 
PACF 是确定阶 m 的有用 T 具因为 不是同分布的，所以 h 述模型的最小二 
乘估计是相合的，但不是有 效的. 当样木容量较小时，砷的 PACF 可能不是有效的. 
估计 

在 ARCH 模型的估计中通常用到的似然函数有三个.在正态性的假定下， 
ARCH ( m ) 模型的似然函数为 


/(ai ， … .(lr |a) = f (a T \F T -\) f {a T -i |F r _2 ) • • • / (am+i l^m ) / (ai, ••- ,a m |a) 


T 


1 




exp 



X /(«!,••• ,a m I Of), 


其中 at = (au,o ； i, - . . ,a m )\ / (aj, ••- , a„, ) 是 q ，•. • ，的联合概率密度函数, 
因为的精确形式是复杂的，故通常把它从上述似然函数中去掉， 
特别足当样本容里很大时.这就导山了条件似然函数 
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/( flm + i ，"、 arlo ：， ai，".，a m )= [[ - g exp 

t=m+l V 


a [ 

2of 


其中 4 可以递推地计算.我们把由最大化上式而得到的估计称为正态假设下的条 
件最大似然估计 (MLE). 

最大化条件似然函数等价于最大化它的对数，而后者比前者容易处理一些.条 
件对数似然函数是 


r r 1 1 1 

I (o-m+ii * * * l«, fli, ••- ,am ) = ^ In (2 jt )— 豆 In (of)— 泛 


= m + l 


2 ^FJ 


因为第一项 In ( 2n ) 不包含任何参数,对数似然函数变成 


/(Om 十 1 ，… ,ar |«,a l7 • -- , a m ) 


T 

E 






其中 = a 0 4 - n /\ n? t _ x + . •. + fy ni af_ ul 可递推地计算. 

在有些应用中，假设^服从像标准化的学生 -< 分布这样的厚尾分布更合适 
—些.设随机变量 A 服从自由度为 v 的学生 * 分布.则 V > 2 时有 Var^,,) = 
«/ (v -2), 我们记= x v / y / v / (v-2). 的概率密度函数为 

/(tt k)= 


r((t ； + i)/2) 




-(v+l)/2 


r (v/2) yj(,v - 2 ) Jt 


V 


2 


v > 2, 


(3-7) 


其中 r(x ) 是通常的伽玛函数(即 T ( x ) = . 利用 at = ove t ， 我们 

得到 a t 的条件似然函数 


T 

/ (ttm+i,• • • ,ot |a, A m )= 

t = m +1 


r((t’ + i)/2) l 

l 1 {v/2) yJ{v ~2)no t 


, 1+ (^R 


(… 1)/2 


其中 v > 2 , A rn = (o ,,-.- ,a m ). 我们把由最大化上式得到的估计称为学生 -i 分布 
假定下的条件 MLE. 学生 -/ 分布的自由度可以事先给定，也可以和其他参数起 
估计出来，如果事先给定，它往往是3到6之间的一个值. 

如果学生分布的自由度事先 给定， 那么条件对数似然函数力 


( ® m + 11 * * * 1 ) 


T 

E 


=m-fl 


兮 M 11 (v-ir^) + l 2 [n 




(3.8) 


如果想把 V 和其他参数一起估讣出来.那么包 含自由 度的对数似然函数为 


I (am-hi, ••- >a T |a,v,^l m ) = (7 1 - m) [In (r ((v + 1)/2)) 

—In (r (v/2)) — 0.5 In ((« — 2) it)] -I -1 (a m+1 , • • • , or |a, A m ), 
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其中第二项由 (3.8) 式给出. 

最后可以假定^服从广义误差分布 ( r . F , n ), 其密度函数是 


其中 r (_) 是通常的伽玛函数，且 


— 00 < X < 00, 0 < V ^ oo. 


A = \2 ( - 2 fv ) T {\/ v )/ T (^/ v ) Yf 2 . 


(3-9) 


如果 r = 2,则 GED 分布退化为高斯 分布； 如果 t < 2,则 GED 分布具有厚的尾 
部.可以很容易得到条件对数似然函数 

模型的验证 _ 


对一个正确指定的 ARCH 模型，标准化的残差 

- (h 
at = ~ 

Ot 

是一列独立同分布的随机变量序列.因此，我们可通过检査序列 { 屯 } 来检验所拟 
合的 ARCH 模型的充分性.特别地 ，屯的 Ljung-Box 统计量可用来检验均值方程 
的允分性 ，的的 Ljang-Box 统计量可用来检验波动率力程的正确性.的偏度、 
峰度、分位点对分位点图 （QQ 图）可用米检验分布假定的正确性. S-Plus 中提供 
了许多用来检验模型充分性的残差图. 

预测 

由 (3.5) 式定义的 ARCH 模型的预测可类似于 AR 模型一样递推地得到考 
虑一个 ARCH(m) 模型.从预测原点 h 出发， a 2 h+l 的向前一步预测为 

(1) = a 0 +ai«J + ••• + a m aj +1 _ m . 


向前两步预测为 


(2) = «o + (1) \ a 2 al I ••• 4 a m al +2 ^ m , 

al + l 的向前 Z 步预测为 

m 

o\ (0 = ao + OjCTh (^ ~ t)i (3.10) 

t=l 

其中，若 f — i < 0,则 4 (f 一 i ) = 

3.4.4 — 些例子 

本节通过两个例子来说明 ARCH 模型的建模. 
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例 3.1 我们首先应用建模方法来给 Inte ] 公司股票的月对数收益率建立一个简单 
的 ARCII 模型•图: M 中收益率平方序列的 ACF 和 PACF 清楚地表明了条件异方 
差性的存在 . 3.3 节给出的 ARCH 效应检验进一步证实了条件异方差性的存在.接 
F 来我们要做的是识别 ARCH 模型的阶.图 3- ld 中的样本 PACF 表明 ARCH (3) 
模型可能是合适的，因此下面将对 Intel 股票的月对数收益率具体建立一个如下形 
式的 模型： 

r t = fx-h a t , a t = a t e t , a'f = a 0 + Qiaf^ + a 2 a?_ 2 + a：iaf_ 3 . 

假定心是独 立同分 布的标准正态序列，我们得到的拟合模型为 

r t = 0.017 1 + a t , af =0.012 0 + 0.178 7 a?_j 4- 0.077 2 af — 2 + 0.057 2 aJ _ 3 , 

各个参数估计值的标准误差分别是 0.006 6, 0.001 1, 0.080 3, 0.050 6和 0.07 G 9,参 
见下面的输出结果_尽管估计值满足 ARCH (3) 模型的一般条件，然而（* 2 和的 
估计值在5%的水平下不是统计显茗的，因此模型可以简化. 

S - Plus 演示 

下面是输出结果，这里％表示注释. 

> arch3.fit=garch(intc-l # -garch(3 # 0)) 

> summary(arch3.fit) 

Call ： 

garch(formula.mean = into - 1, formula.var = - garch(3, 0)) 

Mean Equation ： intc - 1 

Conditional Variance Equation ： - garch(3 # 0) 

Conditional Distribution: gaussian 


Estimated Coefficients: 


Value 
C 0.01713 
A 0.01199 
ARCH(l) 0.17874 
ARCH(2) 0.07720 
ARCH(3) 0.05722 


Std.Error t value 
0.006626 2.5860 

0.U01107 10.8325 
0.080294 2.2260 

0.050552 1.5271 

0.076928 0.7438 


Pr(>|tI) 
0.005047 
0,000000 
0.013309 
0.063800 
0.228747 


% one-sided 
% p-value 


> archl=garch(intr^l # ^garch(l r 0)) % A simplified model 

> summary(archl) 

Call ： 

garch(formula .mean - intc - 1, fox'muld. vdx = - garch (1,0)) 
Mean Equation: intc - 1 

Conditional Variance Equation ： - garch(l r 0) 

Conditional Distribution : gauB6ian 


Estimated Coefficients: 
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Value Std.Error t value Pr(>|t|) 

C 0.01741 0.006231 2.794 2.737e-03 

A 0.01258 0.001246 10.091 0.000e+00 

ARCH ⑴ 0.35258 0.088515 3.983 4.094e-05 


> stdresi=archl$residuals/archl$sigma.t % Standardized 

> autocorTest(stdresi # lag=10) % residuals 

Null Hypothesis ； no autocorrelation 

Test Statistics : 

Test Stat 13.7820 p.value 0.1832 

Diet. under Null : chi-square with 10 degrees of freedom 

> archTest(stdresi,lag=10) % ARCH test for residuals 

Null Hypothesis : no arch effects 
Test Statistics : 

Test Stat 11.3793 p.value 0.3287 

Dist. under Null : chi-square with 10 degrees of freedom 

> archl$aaymp.sd % Obtain unconditional variance 
[1] 0.1393796 


> plot(archl) % Obtain various plots, including the 
% fitted volatility series. 

去掉两个不显著的参数，我们得到的模型为 

T t = 0.017 4 + a t , a \ = 0.012 6 + 0.352 Qa 2 t _ x , (3.11) 

其中各参数估计的标准误差分别为 0.006 2, 0.001 2和 0.088 5,且所有估计都是髙 
度显著的.图 3*4 显示的是标准化的残差的时间图和标准化残差 {由} 的某些 
函数的样本 ACF. 标准化残差{屯}的 Ljung - Box 统计量为 Q (10) = 13.78, p 值为 
0.18. {苟}的 Ljung - Box 统计量为 Q (10) = 11.38, p 值为 0.33, 参见输出结果•因 
此•在5%的显著性水平下， (3.11) 式的 ARCH ( l ) 模型能充分地描述给定数据的条 
件异方差性. 

(3.11) 式的 ARCH ⑴有一些有趣的 性质： 首先， Intel 公司股票的月对数收益 
率的期望值大约1.74%,这是值得注意的.特别是样本包含了 Intel 公司泡沫后的 
时期； 其次，= 0.353 2 < 1/3,从而 Intel 公司股票月对数收益率的无条件四阶矩 
是有限的：再次， r , 的无条件标准差是 y ^ O .012 6/(1 - 0.352) = 0.139 4;最后，该 
ARCH ( l ) 模型可以用来预测 Intel 股票收益率的月波动率. 

学生彳分布的新息 

为了比较，在新息服从学生 -/ 分布的假定下给该序列拟合个 ARCH(l) 模 
型： 

r t = Q.022 1 + a t , ^ = 0.013 4 十 0.249 2a?_ 1} (3.12) 
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图: M 对 Intel 公司股票从1973年1月至2003年12月的月对数收益聿建立萵斯 ARCTI(l) 

模型 (3.11) 式后，各种模型检验统计量的值： （a)，（b), (c) 分别是标准化残差本身、它 
们的平方以及绝对值序列的样本 AC7F，（d) 是标准化残差的时间图 


其中各参数估计的标准误差分别为 0.006 0, 0.002 0 和 0.115 6. 学生分布自由度 
的估计值是 6.16, 标准差是 1.65. 所有估计值在 5% 的水平下是显著的，但心的/统 
计量仅为 2 .16. 的无条件标准差是 x/0.013 4/ (1 - 0.249 2) = 0.133 6, 这与正态性 
假定下得到的/统计量的值相近.标准化残差的 Ljunfi-Box 统计量为 Q (12) = 16.1, 
V 值为 0.19, 证实均值方程是充 分的. 但是，标准化残差平方的 Ljung-Box 统计量 
的值为 Q (12) = 29.91, v 值为 0.002 9. 波动率方程在 5% 的水平下是不充分的.进 
—步的分析表明，拉格朗日乘子检骑统汁量的值为 Q(10) = 13.07, p 值为 0.22 .波 
动率方程的不充分性是由于标准化平方残差中存在更高阶的相关性. 

比较模型 （ 3.11) 式和 (3.12) 我们可以看到以下几 点：⑷ 使用具有厚尾分 
布的可以降低 ARCH 效应； （ b) 对这个特殊例子来说，这两个模型差别不大.最 
后 ，对这组数据更适合的模型是 GARCH(1 ， 1) 模型.刈此将在下一节给出讨论 .' 

S-Plus 演示 

带 < 分布的新息. 

> archlt=garch(intc-1,-garch(l # 0) , cond.dist = # t # ) 

> summary(archlt) 

Call ： 

garch (formula.mean = intc - 1, formula, var = - garch(l, 0) # 
cond. dist =. " t") 
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Mean Equation ： intc - 1 

Conditional Variance Equation : - garch(1, 0) 

Conditional Distribution : t 

with estimated parameter 6.159751 and standard error 1. 6470*34 
Estimated Coefficients : 


Value Std.Error t value Pr(>|t|) 
C 0.02213 0.006010 3.681 1.333e-04 

A 0.01338 0.001965 6.809 2.001e-ll 

ARCH ⑴ 0. 24916 0.115574 2.156 1 .587e-02 


AIC(4) = -477.9073, BIC(4) = -462.2317 
Ljung-Box test for standardized residuals : 


Statistic P-value Chi x 2-d.f. 

16.1 0.1868 12 

Ljung-Box test for squared standardized residuals : 

Statistic P-value Clii*2-d. f . 

29.91 0.002882 12 

注释在 S - Plus 中.命令 nARCTH 允许几种条件分布 _ 具体来讲是， cond . dist = 
" t ’ ’或‘ ' ged * *, 缺省时为高斯分布. 口 

例 3 . 2 考虑马克对美元十分钟时间间隔汇率的百分比变化量.图 3-2 a 已经给山 
了该数据的时间图.如图 JKJa 显示的，此序列没有序列相关性.但其平方序列的 
样本 PACF 有些大的值.特别是间隔为1和3时.在某些较大的间隔时 ， PACF 
有较大的值.但较小的间隔更重要一些.按照前一小节 i 彳论的方法，我们将对该 
序列拟合一个 ARCH (3) 模型. 利用条件高斯似然函数，我们得到拟合的模型是 
r f = 0.001 8十 和 

^ - 0-22 x 1( 厂 2 + 0.322 a ?_ 1 4- 0.074 a ?_ 2 4- 0.093 a ?_ 3 , 

其中波动率方程中所有的估计在 5% 的水平下都是统计显著的，标准误差分别是 
() . 47 x 10-«, 0.017, 0.01 6 和用标准化的残差心进行的模型检验.表明了该 
模型是充分的. 

3.5 GARCH 模型 

虽然 ARCH 模型简单.但为/充分地描述资产收益率的波动率过程，往往需 
要很多参数.例如，考虑下面例 3.3 中的 S&P500 指数的月超额收益率.其波动率 
过程需要 ARCH ⑼模型来刻画.这样就必须寻找其他模型. BoUerslev(1986) 提出 

个有用的推广形式.称为广义的 ARCH 模型 (GARCH). 对于对数收益率序 








1 U 0 第 3 章条件异方差模型 


列 r f , 令= r t - //_/ 为/ 时刻的新息.称 a < 服从 GARCH ( m , s) 模型，若 a t 满足 
下式： 

m .« 

at = (T t £ t , af = «q -f Y" a.a^ 4 - ^ (3.13) 

t=l .7=1 

其中 kt} 是均值为0、方差为 1 的独立同分布随机变量序列， tt 0 > 0, 0, 0 3 ^ 0, 

max (m ,3) 

亡 (a, 十风）< 1 (这里对 i > m, a 丨= 0,对 j > s , 巧 一（)) .对叫十爲的限 

制牛保址 a< 的无条件方差是有限的，同时它的条件方差疗是随时间变化的.如 
前囪一样.通常假定 e t 是标准正态的或标准化的学生分布或广义误差分布.若 
« = 0, (3.13) 式就简化成一个 ARCH(m ) 模型 . a , 和内分别称为 ARCH 参数和 
GARCH 参数. 

为了弄清 GARCH 模型的性质，采用如下表示是有用的.令屮= < - 也 
即 of = a’f — %.把 of_| = - r } t - i{i = 0, •• - , s ) 带入 (3.13) 式，我们就能把 

GARCH 模型改写成如下形式 

max(m v «) 9 

a t = 4- > : (<>i + fli) + f}t — > : f^jVt j- (3.14) 

*=i i=i 

容易验证 {T/t} 是•个铁差序列（即 E 7 /t = 0 且对 J •彡1有 CO \( T ] t , T ] i - j ) = 0) .但 [;/t} 
般不是独立同分布 序列. (3.14) 式对序列4来说是 ARMA 形式，囚此 GARCH 
模型可认为是 ARMA 的思想对平方序列 < 的应用.利用 ARMA 模型的无条件均 
值，我们有 

E (a^) = - . 

1 - E t ra = T (m,fl) K + A) 


只要上式的分母是正的. 

GAKCH 模型的优点和缺点，可以通过对最简单的 UARCH ( U ) 模型的分析看 
出. GARCH (1，1) 模型为 

<7/ 2 = «(, -f «ia^_ l + !3\al_ x , 0 彡 cn, (3i ^ 1, 叫十汍 < 1. (3.15) 

第一，大的或引起大的这意味着大的会紧跟着另一个大的 
这样就会产生在金融时间序列中有名的“波动率聚集”现象.第二，可以证明：若 
1 — 2 c >；| — («1 + /? i )2 >• 0,贝 lj 

E (af) 3 1 - (ai + 负 ) 2 

[^(a?)] 2 ~ 1 -(«x+^i) 2 -2«? > 

从 Iftj . 与 ARCH 模型类似， GARCH (1,1) 过程分布的 M 部比正态分布尾部厚.第三. 
此模型给出了一个简单的参数函数来描述波动率的演变. 
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GARCH 模型的预测可用类似于 ARMA 模型的方法得到.考虑 (3.15) 式的 
GARCH(1,1) 模型，假定 h 为预测原点.对向前一步预测，我们有 

^h-bi = «o + Picrh 

其中， M 和4在时间指标为 / j . 处是己知的.因此，向前一步预测为 

(1) = «o + cnial + 

对向前多步预测，我们用 a? = afel 并把 (3.15) 式的波动率方程改写成 

°f+i = a 0 + (ai + 仇） of + aiaf (ef - 1). 

当 * = "+1 时，此方程变为 


^4-2 = an + (ai + 0\) ( r'h ^ + aial +1 ( fj +1 - 1). 

因为 E (4 + i _ 11凡）= () ，故以"为预测原点的波动率的向前2步预测满足 

⑺ = rto 十 （ o；i P\)(r^ (1), 


一般地，我们有 

°h (0 = Oo + («1 +/3i)al (Z - 1), l > 1. (3.16) 

这个结果与自回归多项式为 l-( ai 的 ARMA(1,1) 模型是完全相同的.对 

(3.16) 式重复迭代.我们得到向前/步预测能写成 


(0 = 


«o [1 -( 叫十汍/- 1 
1 _ Q !! — f 3 i 


+ («i + /5 i )’ 1 erg ⑴. 


从而.只要«!+/?!< 1,就有 


a h (0 ~ * 


Qu 

1 - aj - /3 t 


当 Z — oo 时. 


因此，只要山的无条件方差 Var ( a ,) 存在，当预测步长趋于无穷时， GARCH (1,1) 
模型的向前多步波动率顸测是收敛于 Var ( a t ) 的. 

关十 CiARCH 模型的文献非常多，读者可参见 Bollerslev, Chou 和 Kroner(1992), 
BoUerslev, Engle 和 Nelson(1994), 以及这两篇文章的参考 文献. GARCH 模型与 
ARCH 模型有相同的弱点，例如，它对正的和负的“扰动”有相同的反应.另外，新 
近关于高频金融时间序列的实证研究表明 GARCH 模型的尾部太薄，即使新息是服 
从学生分布的 GARCH 模型，也不足以描述实际高频数据的尾部.关于 GARCH 
模型峰度的研究，参见: U 6 节. 
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3.5.1 实例说明 

ARCH 模型的建模方法也可以用来建立一个 GARCH 模型.然而. GARCH 模 
型的阶不太容易确定.在实际应用中.只用到低阶的 GARCH 模型，如 GARCH ( U ) 
模型、 GARCH (2，1) 模型、 GARCH (1.2) 模型等.假定波动率 {#} 的初始值是已知 
的，条件最大似然法仍然可以用.例如，考虑 GARCH (1,1) 模型， 若认为 erf 是固定 
的，则 GARCH (1,1) 模型的疗可以递推得到.在一些应用中 ，叫 的样本方差作为 
^ 的初始值较好.可以用标准化的残差 A = a t /a t 和它的平方序列来检验所拟合 
的模型的充分性. 

例 3.3 在这个例子中，我们考虑 S & P 500 指数的月超额收益率，从1926年开始, 
共792个观察值，如图3>5所示.记 n 为超额收益率.图3~6所示的是 n 的样本 
ACF 和 j 的样本 PACF . 序列在间隔为1和间隔为3时有少许序列相关性，但 
主要特征还是 rf 的 FACF 显示强烈的线件相关件.若拟合 MA (3) 模型，则得到 

r t = 0.006 2 + a , + 0.094 4 at，i - 0.140 7 a t _ 3 , cr a = 0.057 6, 

其中所有的系数在5%的水平下都是显著的.然而，为简单起见，我们使用 AR (3) 
模型： 

n = 伞 in-1 + 02n 一 2 + 03 『 t -3 + A) +a t . 

在正态性的假定下，所拟合的 AR (3) 模型为 

r t = 0.0880-! - 0.023 r t _ 2 - 0.123 r t _ 3 + 0.006 6 + a t , ( r 2 a = 0.003 33. (3.17) 

对 GARCH 效应，我们用 GARCH (1，1) 模型 

at = <r t £t, of = «o + + 


0.4 


1).2 


0.0 


— o .*2 


图 3*5 S & P 500 指数月超额收益率的时间序列图 
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图 3-6 ( a ) S & P 500 指数月超额收益率的样本 ACF ; ( b ) 月超额收益率平方的样本 PACF 

对该 AR (3)- GARCH (1,1) 模型进行联合估计得到 

r t = 0.007 8 + 0.032 r t _i - 0.029 r t _ 2 - 0.008 r t _ 3 + a t , 
of = 0.000 084 + 0.121 3 a ?_, + 0.852 ^ a 2 t _ x . 

由波动率方程， a t 的隐含的无条件方差为 


0.000 084 n … 

1 - 0.852 3 - 0.121 3 = 0 003 17, 

这与 (3.17) 式中的的非常 接近. 然而,均值方程中的各参 数的卜 比表明三个自回 
归系数在5%的水平下都不显著.因此，我们去掉所有自回归系数来改进模型，改 
进后的模型为 

n = 0.007 6 + a ，， a \ = 0.000 086 + 0.121 + 0.851 (3.18) 

均值方程中常数项的标准误差为 0.001 5,而波动率方程中三个参数的标准误差分别 
为 0.00() 024, 0.019 7和 0.019 0. 的无条件方差为 0.000 086/(1 -0.851 1 -0.121 fi ) 
= 0.003 14. 这是一个简单的平稳 GARCH ( l . l ) 模型.对于 (3.18) 式的 GARCH (1,1) 
模型.图3~7所示的是被估波动率过稈 q 和标准化的“扰动”屯的时间图. 
at 序列看起来像白噪声过程，图 3*8 给出了标准化残差\和努的样本 ACF , 这 
两个 ACF 不能表明在标准化残差过程中有显著的序列相关性或条件异方差性.更 
具体地说，对&我们有 Q (12) = 11."(0. 4 5)和 Q (24) = 28.52(0.24)， 对碎有 
Q (12) = 13.11(0.36), Q {2\) - 26.15(0.33), 括号中的数为对应检验统计量的 p 值. 
因此，模型似乎能充分描述收益率序列和波动率序列的线性相依关系.注意到所拟 
合的模型表明 d , + ^ = 0.977 2,非常接近于 1. 这种现象在实际中是常见的，以 
至于经常在 GARCH (1,1) 模型中加上限制 «,+A = l , 从而引出求和 GARCH (或 
IC ， ARCH ) 模型，见 3.6 节. 
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图 3-7 ( a ) 对 S & P 500 指数的月超额收益佔计出的波动率的时间序 列图； （ b ) S & P 500 指数的月 

超额收益率的标准化“扰动”的时间序列图.两个图都是基于 （3.18) 式的 GARCH ( i , l ) 
模型 
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阁 3*8 对 S & P 500 指数的月超额收益率所建的 GARCH ( U ) 模型 （3.18) 式的模型 检验： 
( a ) 标准化残差的样本 ACF ; ( b ) 标准化残差平方的样本 ACF 

最后，为了预测 S & P 5 UU 指数的月超额收益率的波动率，我们 nj 以用 (3.18) 式 
屮的波动率 力程. 例如，在预测原点/ I ，有 My =0.000 086 + 0.121 6 a ); + 0.851 1^. 
向前1步预测是 

o\ (1) = 0.000 08 G 十 0.121 Ga ^ + 0.851 1^, 

其中 M 是纟时刻均值方程的残差，4由波动率方程得到_初始值 ag 可取（】或~ 
的无条件方差.对多步向前预测.我们可以利用 (3.16) 式的递推公式.表 3-1 给出 
了基于 (3.18) 式的 GARCH (1,1) 模型、以 /i 为预测原点对 S & P 500 指数月超额收 
益韦的均值以及波动率预测的结果. 
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表 3-1 S & P 500 指数的月起额收益率的波动率预测.预测原点为/^ = 792,对应的时间 
点为1991年12月.此处，波动率是条件标准差 


预测步长 

1 

2 

3 

4 

5 


收益率 

波动串 

0.007 6 

0.053 6 

0.007 6 

0.053 7 

0.007 6 

0.053 7 

0,007 6 

0.053 8 

0.007 6 

0.053 8 

0.007 6 

0.056 0 


例3. 3 中用到的一些 S - Plus 命令 

> f it=garch (sp-ar (3) , -garch (1,1" 

> summary(fit) 

> fit=garch(sp-l # -garch(1,1)) 

> summary(fit) 

> nam^.q (fit) 


[1] 

" residuals" 

M sigma.t n 

M df.residual ， 

’ "coef" "model 

【 6] 

•_ cond.dist" 

"likelihood" 

"opt•index" 

•* cov w 

U0 】 

"prediction" 

” Cdll._ 

"asymp.sd" 

"series" 


> % Next # compute the standardized residuals 

> stdresi=fit$residuals/fit$sigma.t 

> autocorTest(stdresi,lag=24) 

> autocorTest(stdresi^2 r lag=24) 

> predict(fit,5) % Compute predictions 

汴意到在上述命令中波动率序列存储在 fit $ sigma . t 中，收益率的残差序列 
存储在 fit$residuals 中. 

学生 - t 分布的新息 

假定心 服从自由度为 5 的标准化学生\分布，我们重新估计 GARCH (1，1) 模 
型.得到 

r t = 0.008 5 + a t , cf = 0.000 12 + 0.112 la {_ 1 + 0.843 2 t 7 t 2 _ j , (3.19) 

其中参数的标准差分别为 0.001 5, 0.51 x 10- 4 , 0.02 D 6 0.037 1,这个模型本质 

上是-■个 IGARCH ( U ) 模型. 因为 0.95, 非常靠近 1. 标准化残差的 
Ljung-Box 统计量为 Q (10) = 11.38, p 值为 0.33, 而# 的 Ljung-Box 统 i | 量为 
Q (10) = 10.48, p 值为 0.40. 这样所拟合的带学生 -f 分布新息的 GARCH ( i . i ) 模 
型足充分的. 

用到的 S-Plus 命令 

> fit 丄 = garch(sp-1 # 〜 garch(1 , 1) , cond•dist='cond.par=5 # 

♦ cond.est-F) 

> summary(fit1) 

> stresi=fitl$reaiduals/fitl$sigma.t 

> autocurTest(stresi r lag=10) 

> autocorTest(stresi A 2,lag^lO) 

自由度的估计 

如果我们更进一步地拓展上述 GARCH (1,1) 模型，其中学生 j 分布的自由度 
不是给定的而是通过数据估计出的，得到的模型为 
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r t = 0.008 5 + a tl of = 0.000 12 + 0.112 laJ_j -I- 0.843 2a 2 t _ x , (3.20) 

其屮所估计的自由度为 7.02. (3.20) 式中参数估计值的标准误差与 (3.19) 式的非常 
接近.自由度估计的标准误差为 1.78. 从而，在 5% 的显著性水平下我们不能拒绝 
使用&由度为 5 的学生 -t 分布. 

用到的 S - Plus 命令 

> fit2 = garch(sp-l # -garch(1,1) # cond.dist= r ) 

> summary(fit 2 〉 

3.5.2 预测的评估 

由于资产的波动率是不能直接观测的，所以比较不同波动率模型的预测表现对 
数据分析师来说是一个 挑战. 文献中，有的研究人员利用样本以外 ( out - of - sample ) 
的预测，比较波动率的预测值 4(0 与预测样本中的“扰动”来评价波动模型 
的预测表现采用这个方法常常会发现和以⑴有较低的相关系数.即低的7? 2 . 
这个发现并不奇怪，因为单独的本身不能充分度量/» + /时刻波动的率.例如, 
对向前一步预测.从统计观点讲， E(al +l \F h ) = ^ + 11 因此 4 +1 是的相合 
估计.但它不是的精确估计，因为一个有已知均值的随机变量的单个观测值 
不可能提供该随机变景方差的精确估计.从而，严格地说.这种评价波动率模型预 
测表现的方法是不正确的.关于 GARCH 模型预测评价的更多信息.读者可参见 
Amierseu 和 Dollerslev ( 1 998). 


3.5.3 两步估计方法 

基于 （3.14) 式，可以用两步估计方法来估计 GARCH 模型.第一步，忽略 ARCH 
效应.用第2章讨论的方法（例如最大似然方法）为收益率序列估计一个均值方程. 
残差序列用 表示. 第二步，将作为观测序列，可以用最大似然方法估计 
(3.14) 式中的参数•用士和么分别表示 AR 系数和 MA 系数，则 GARCH 模型的 
参数估计为戌 = t a t = 0, - 6 X . 显然，这样的估计只是真实参数的一种近似，它 
们的统计性质并没有得到严格的研究.然而，限定在定范围内的经验表明，这个 
简单的方法往往能够提供好的近似，尤其是当样本容量适中或较人时更是如此.例 
如，考虑例 3.3 中 S & P 500 指数的月超额收益率.用 SCA 中的条件似然方法，我们 
可以得到下述 模型： 

,.t = 0.006 1 + a ^, af = 0.000 14 + 0.958 3 af_ x + i]i — 0.845 6 r "_ i . 

其屮，所有的佔计在5%的显著性水平下都显著地不为 a 从这些估计中看出，戾= 
U .845 ti , ai = U .958 3 - 0.845 6 = 0.112 7. 这种近似估计与 (3.18) 式和 (3.20) 式中 
的估计非常靠近.进一步地，用构步估计方法拟合的波动率与图 3-7 a 也非常靠近. 

^也就是把粮个样本分成两个部分.用•部分（往往足大部分）来预测另一部分（称为预测样本).可得 
和4⑴.——译者注 
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3.6 求和 GARCH 模型 

若 (3.14) 式中的 GARCH 表示的 AR 多项式有一个单位根.则我们就得到了 
IGARCH 模型.因此. IGARCII 模型就是单位根 GARCH 模型.类似于 AFUMA 模 
型， IGARCH 模型的主要特点是过去的平方扰动屮_, = ，- / > () 对4的 

影响是持久的. 

一个 IGARCH (1,1) 模型能写成 

a f = a t E iy a \ = a 0 + + (1 - 仇) a?_ lt 

其中 U ,} 与前面一样定义 .1 > 汍 > 0 .对 S & P 50 Q 指数的月超额收益率数据估计 
出的 ir , ARCH(1 1 ) 模型为 

r ( = 0.006 7 + a 卜 at = a t £ t , 

of = 0.000 119 + 0.805 90- f ，! 4- 0.194 laf _ l5 

其中波动率方程中各估计的标准差依次是 0.001 7、 0.000 013、 0.014 4. 参数的 
估计值与前面的 GARCH ( l , l ) 模铟很 接近，但这两个模型间有一个大的差别.在 
IGARCH (1,1) 模型下 . ~的无条件方差.也即的无条件方差，是没有定义的.这 
一点对超额收益率序列是难以验证的.从理论观点看， IGARCH 现象可能会是波动 
率常有的水平移动所引起的.波动率持续性的真正原因值得仃细研究. 

当《丨+负=1时，由 (3.1 G ) 式重复迭代得到 

4 (,) = 4 ⑴ + ( 卜 1) «0，^ 1, (3.21) 

其屮 h 是预测原点.由此 . of〆 〗） 对将来波动率的效应也是持续的， 波动率 预测形 
成了一个斜率为吻的直线. Nelson (1990) 研究了在 IGARCH 模型卜波动率过程 
^ 的某些概率性质.过程矸是一个鞅、它在文献中有一些漂亮的结果可用.在一 
些条件下，波动率过程是严平稳的.但不是弱平稳的.这是因为它的前两阶矩不存 
在. 

在研究 IGARCH (1,1) 模型时， a o = 0 的情形是特别令人感兴趣的.这时,对所 
有预测步长.波动率的预测值都是4⑴，参见 （3.21) 式.这个特殊的 IGARCH ( l . l ) 
模型正是风险度量系统 RiskMetrics 所用的波动率模型，这个系统是一种计算风险 
值 (Value at Risk ) 的方法 （见第7章).该 模型也是序列 {«,?} 的指数平滑模型.为 
说明这点，将模型改写为 

of = (1 - (3i)al^ -h 

==(1 — + — /?X _ 2 十 /3iof_ 2 ] 

=(1 - ) a t -I + (1 - A)A a f-2 + ^l a t-2 
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重复迭代得到 

= (! - ^i)(a?_i + /3ia?_ 2 4- 游 a?_ 3 + - - -)， 

这就是著名的贴现因 于为汍 的指数平滑公式.因此，指数平滑方法可以用来估计 
这样一个 IGAKCJH (1，1) 模型. 

3.7 GARCH-M 模型 

在金融屮，证券的收益率会依赖于它的波动率.为了给这种现象建模，人们会 
考虑 GARCH - M 模型，其中 “ M ” 表示收益率的条件均值为 GAR . CH(GARCH in 
the mean ). 简单的 GARCH (1，1)- M 模型能写成 

r t = fi + caf + a fj a t = o t t t , 

of = a 0 -^ ( h<rh (3.22) 

其中 / x 和〃 是常数.参数 c 叫做风险溢价参数 • c 为正值意味着收益率与它的波动 
率成正相关.文献中还出现过其他一些具体的风险溢价的形式，如 rt = // + cat + a/ 
和 r t = p 丨 clncrf at . 

(3-22) 式的 GARCH - M 模型蕴涵着收益率序列 r > 存在序列相关性.这种序列 
相关性是由波动率过程 { af } 的序列相关性导致的.风险溢价的存在是历史股票收 
益率具有序列相关性的另一种原因. 

为了说明 GARCH - M 模型的应用，我们考虑给 S & P 500 指数从1926年1月 
至1" 】 年12月的月超额收益率拟合一个 GARCH (1,1)- M 模型.并假定该模型的 
新息服从高斯分布.所拟合的模型为 

rt = 0. fl 05 5 + 1 

of = 8.76 x 10— 5 + 0.123 a^_j + O . MDofq , 

其中均值方程中两个参数的标准误差分别为 0.002 3和 0.818, 波动率方程中三个 
参数的标准误差分别是 2.51 x 10- 5 , 0.020 5和 0.019 6. 该指数收益率的风险溢价 
的估计值是正的，但在5%的水平下不是统计显著的_这里的结果由 S - Plus 得出. 
表 3*2 给出了 S - Plus 中 GARCH - M 模型的一些其他具体形式.风险溢价的思想也 
可应用于其他 GARCH 模型. 


表 3-2 S - Plus 中所允许的 GARCH - M 的具体形式" 


g(at) 

命 令 



var.in.mean 



ad.in.mean 


ln(of) 

lo^var.in.mean 



a 均值方程是 r f = /i + cg(cr t ) -f- 
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S-Plus 演示 

> sp.fit = garch(sp-l+var.in.mean,-garch(l # 1)) 

> summary(sp.fit) 


3.8 指数 GARCH 模型 


为了克服 GARCH 模型在处理金融时间序列时的一些弱点， NeLson (1991) 提出 
了指数 GARCII ( EGARCH ) 模型，具体地，为了允许在模型中体现正的和负的资产 
收益率的非 X 、 j 称效应.他考虑加权的 新息： 


5( e t ) =此 4 +7[ kt |- E (| e t |)]， (3.23) 


其中 0 和 7 是实常数 . Q 和 k t |- E (| et |) 都是零均值的独立同分布序列，且有连续 
的分布.因此， =0. y ( e t ) 的非对称性容易从下式 看出： 


( J ^ i ) = 


(0 + 7 )^-7 E ( k t |), 

{0 - 7) £t -7 E (|£- t |), 


若 e t 彡0, 
若 < 0. 


注释对标准高斯随机变量 e ,， E (| e ,|) = 对 （3.7) 式中的标准化学生彳 


分布.我们有 


E (| e t |) = 


2sfv^2Y {{v + \)/2) 
(u - 1) T (v/2) v/it 


EGARCH ( m , s ) 模型能写成 


at = lu ( of ) = « 0 十 …二二 08 a : n B ;、 ㈨ - i ) ， （3.24) 

其中 a 。 是常数 ,0 是向后推移算子使得 Bg ( E t ) = l +/? ifi +-• .+ U * _1 

和 i — mz ? - ttrnB m 是多项式，它们的根都在单位圆外 a 没有公因子.根在单 

位圆外，意味着根的模大于 1. (3.24) 式又一次用通常的 ARMA 参数化形式来描述 
n t 的条件方差随时间的演变.基于这个表示， EGARCH 模型的一些性质可以用与 
对 GARCH 模型所用的类似方法得到，例如 In (4) 的无条件均值为勿.然而，这 
个模型在如下几点上与 GARCH 模型 不同： 第一，它使用条件方差的对数，放松了 
对模型系数非负性的 限制； 笫二, g ( c t ) 的使用.使得对…的正的和负的延迟值，模 
型的反应不对称. EGARCH 模型的其他性质可在 Nelson (1991) 中找到. 

为了更好地理解 EGARCH 模型，我们考虑阶为 (1.1) 时的简笮 情形： 


a t = c t £ t , ( l - aB)ln ( a ^) = (1 - a ) a 0 + ( et - i ), (3.25) 


其中 {^} 是独立同分布标准正态序列， ~ 的下标被省略了.在这种情形下， E ( k t |) 
s /2/^ z . 1 b (^ 2 )的模型变成 


(1 — aD ) In ( of ) 



+ (7 + ^)^- i , 
a . + (7 — 0 ) (- ee _ i ) 


当 ^ t -1 > 0 时， 
当 e t -i < 0 时， 


(3.26) 
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其中《：» = (1 - a) «0 - v/27^7 - 这是一个非线性函数，类似于 Tong(1978, 1990) 中 
的门限自回归 （ TAR, threshold autoregressive) 模型.这里我们只要知道：对这个简 
单的 EGARCH 模型来说，条件方差以非线性方式依赖于的符号.具体地说， 
我们有 


= c 

r t-l cxp ( d .) 1 

f 

exp 

( 7 + 0) 



exp 

( 7 -0) 


当 at -! 彡0时， 
当 a . f — !_ < 0时， 


系数 （7 +⑺和 （7 _ 60表明模型对正的和负的 ay 的非对称响应.因此，当《 # 0 
时模型是非线性的.由于负的扰动往往带来更大的影响，我们假定0是负的.对高 
阶 EGARCH 模型来讲，非线性性变得复杂得多 . Cao 和 Tsay (1992) 利用非线性模 
型，包括 EGARCH 模型，得到向前多步波动率的预报.第4章将讨论金融时间序 
列的非线性性. 


3.8.1 模型的另一种形式 

EGARCH(m,s) 模型的 另一种 形式为 


In(orf) = Qp + ftj l a ’-i 十 ln(o?_,). (3.27) 

*=1 u t—i j=l 

这里，正的 《 对对数波动率的贡献为 ％(1 + 7 .) ke - il ， 而负的对对数波动率 
的贡献为 — 7»)k<- *li 其中 q i — a t -i/a t -i. 参数表示的杠杆效应.在 
实际应用中，我们仍然假定 7 ,为负的.这是 S - Plus 中所用的模型形式. 

3.8.2 实例说明 

Nels OI i (1991) 把 EGARCH 模型应用到价值加权市场指数的月超额收益率上， 
数据是从证券价格研究中心得到的，时间区间是从1962年7月至1987年12月. 
超额收益率是用价值加权指数的收益率减去国库券的月收益率，假定一个月中每一 
天的国库券收益率是常数.共有6 408个观察值.用 n 表示超额收益率，所用模型 
为 

r t = «^0 I < f > ir t -i + corf + a tl (3.28) 

In (trf) = o： 0 + In (1 ^ wN t ) + ㈨ -山 

其中 < 是给定下〜的条件方差，爪是第< - 1个交易日和第/个交易日之 
间的不交易的入数， a 0 和是实参数，由 (3.23) 式定义 • Q 服从 (3.9) 式的 
广义误差分布.与 GARCH - M 模型相似， (3.28) 式中的参数 r 是风险溢价参数.表 
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13给出了模型的参数估计值和它们的标准误差. (3.28) 式的均值方程有两条性质 
值得 注意： 第一，它用 AR (1) 模型来刻画超额收益率中的序列相 关性； 第二，它用 
波动率4作为回归变量来解释风险溢价.所估计出的风险溢价是负的，但是统计 
不显著的. 


表 3-3 对价 值加权 CRSF 市场指数的日超额收益率估计出的 AR (1)- EGARCH (2, 2) 


模型，数据是从1962年7月全1987年12月 


参数 

«0 

W 

7 

ai 

a 2 

/3 

佔计值 

一 10.06 

0.183 

0.156 

1.929 

-0.929 

一 0.978 

标准诶差 

0.346 

0.028 

0.013 

0.015 

0.015 

0.006 

参数 

0 

加 


c 

V 


估计值 

-0.118 

3.5 x 10— 4 

0.205 

一 3.361 

1.576 


标准误差 

0.009 

9.9 x 10~ 5 

0.012 

2.026 

0.032 



3.8.3 另一个例子 


作为另一个说明，我们来考虑 IBM 股票从1962年1月至1997年12月的月 
对数收益率，共864个观察值.拟合一个 AR (1)- EGARCH (1,1) 模型： 


re — 0.01() 5十 0.092 n_i 十 at , oj — cr t e t , (3.29) 


In (rr?) = -5.496 4 - L _ 0 厕 g H 
g {E t -i) = -0.079 5e,_i 4 - 0.264 7 - y/2/n 


(3.30) 


其中彳是一列独立的标准高斯随机变 M 所有参数估计值在5%水平下都是统 
计显著的.至于模型的检验.标准化的残差过程 a , = 的 Ljung-Box 统计量为 
Q (10) = 6.31(0.71) 和 Q (20) = 21.4(0.32), 而对平方过程 Q (10) = 4.13(0.90) 
和 Q (20) - 15.03 (0.66), 括号中的数是 p 值.因此，在所拟合模型的残差序列中没 
有序列相关性或条什异方差性,这说明所拟合的模型是充分的. 

由估计出的波动率方程 （3.30) 式，并利用 s / 2 ]h « 0.797 9 ; 我们得到波动率方 

程力 


In (of) = 


-1.00H-0.85Gln(a^_,) + 



0.185 

-0.344 2 E t - X , 


当 e t _i > 0 时， 
当 心_1 < 0 时. 


作一个反对数变换.我们有 


f e 0 185 当 et - iX ) 时， 

\ e — 0 344 2sr «->, 当 < 0时. 


此方程说明了在 EGARCH 模型下波动率对过去正的和负的“扰动”的反应不对称. 
例如.当标准化的“扰动”扰动两个单位（即两个标准差）时， 
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of (tt-i = -2) 


exp [—0.344 2 x (—2)] 
exp (0.185 2 x 2) 


e 


0.318 


1.374. 


erf ( £ t-l - 2) 

因此. 变动两个标准差的负“扰动”对波动率的影响要比相同强度的正“扰动”的 


影响高37.4%.这个例子清楚的显示出 EGARCH 模型的非对称特征.一般来说, 
“扰动”越大，正负“扰动”对波动率的影响的差别就越大. 

最后，我们将样本区间进行扩展，使其包含1998年到2003年的对数收益率， 
共有 9 Sfi 个观测.我们用 S - Pliis 拟合一个 EGARCH (1, 1) 模型，结果如下. 


S-Plus 演示 


输出结果. 

> ibm.egarch=garch(ibmln~l , -egarch(1,1),leverage=T, 
+ coud.ditiL= r ged # ) 


> summary(ibm.egarch) 

Call: 

garch( formula.mean = ibmln - 1, formula.var = - egarch(1,1) # 

leverage = T,cond.dist = ” ged") 


Mean Equation ： ibmln - 1 

Conditional Vdriciiice Equation ： - egarch (1, 丄） 

Conditional Distribution ； ged 

with estimated parameter 1.5003 and standard error 0.09912 


Estimated 

Coefficients : 




Value Std.Error t 

value 

Pr(>|t|) 

C 

0.01181 

0,002012 

5.870 

3.033e-09 

A - 

0.55680 

D.171602 

3.245 

6.080e-04 

ARCH(l) 

0.22025 

0,052824 

4.169 

1.669e-05 

GARCH(1) 

0.92910 

D.026743 

34.742 

0 •000e+00 

LEV (1) - 

0.26400 

3,126096 

-2.094 

1.828e-02 

Ljung-Box 

test for 

standardized residuals : 

Statistic 

P-value 

L’hiXt. 



17.ft7 

0.1195 

12 



Ljung-Box 

test for 

squared standardized residuals : 

Statistic 

P-value 

Chi*2-d.f. 



6.723 

0.8754 

12 




拟合的 C , ARCH (1, 1) 模型为 


r t = U.U11 8 + a t , at = a t £t, 

H ^ t ) = -0-557 + 0.220 |at — 11 一 0 264 〜 ― 1 + 0.929 Ui (( t ； 2 _,), (3.31) 

戊卜 1 










3.8 指数 GARCH 模型 113 


其中^服从参数为 1.5 的 GED 分布.某于模型残差及其平方的 Ljuiig - Box 统计量 
表明模型是充分的.正如所预料的那样，输出结果 表明： 估计出的杠杆效应是负的， 
并且在5%的显著性水平下是统计显著的， <- 比是 -2.094. 

3.8.4 用 EG ARCH 模型进行预测 

我们用 EGARCH (1,1) 模型来说明 EGARCH 模型的向前多步预测.假定模型 
的参数已知，新息服从标准高斯分布，我们有 

In (« r t 2 ) =(1 - Q^ao + ajln (< r t 2 _,) +g ( e «- i ), 

9 = 私-1 十 7 _ V ^/ n ). 

两边取指数，模型变成 

(T? = <Tt-\ exp[(l -a 1 )a 0 ]exp[£?(e f _i)], 

9 = ^ t-i + 7 ( kt —1| _ \/2/ 丌) • (3.32) 

设是蚀测原点，对向前 1 步顸测，我们有 

^ h+i = K 1 - ai ) ou ] exp [^ ( e /,)] , 

其中右边的所有量都是已知的.因此以/ I 为预测原点的向前1步的波动率预测是 
ai {\) = < rl + 1 由上式 给出. 对向前2步预测， (3.32) 式给出 

crl+2 = a hVi exp[(l -aOaoJexpffl (e^i)]. 

在 h 时刻取条件期望，我们有 

(2) = ^h ai (l) ex P K 1 - «i)«o] E/ t {exp [g (e/ 4+ i)]}, 

其中 E h 表示在时间原点所取的条件期望.上述期望可以由下式 得到： 

f >00 

E {exp [5(e)]} =J exp ( 9 f + 7 (|c| - \/2/^)] / (^) ^ 

= exp (- 7 \/ 2 /; i ) e (»+7)e — ^ = e ~ g3 ^ 2 de-f J e( g-7 ) e ~^L=e~ g3/2 dg 

= t!Xp (- 7 \/ 2 / ji ) 卜 (0 十 7 ) 十 t ’( d _ 7 ) a /_ 2 中 （7 — 6 1 )] , 

其中/⑷和分别表示标准 m 态分布的概率密度函数和累积分布函数.因此. 
向前2步波动率预测值为 

a^2 )=<^ Q, ⑴ exp (1 - ai)a 0 --yy/ 2 /ji 
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x {exp [(0 + 7 ) 2 / 2 j 办 (沒 + 7) + oxp {0 - 7) 2 /2 4> (7 - 0)| . 

重复前面的步骤，我们得到向前 j 步预测的递推 公式： 

0 ')=^ a ， (j-l)oxp(u ； )x{cxp [( 6 >| 7 ) 2 / 2 ]^( 6 >H- 7 )+exp [(6»- 7 ) 2 /2j 4>( 7 -<?)}, 

其中 w = (1 - ai ) a 0 - 7x /^. 中 ( 0 + 7 ) 和 « I > (7 - 9 ) 的值可以从统计软件包中得 
到.另外，可用第 6 章附录 B 中的方法得到这些值较精确的近似. 

作为例子，考虑 3.8.3 节为 IBM 股票月对数收益率（时间终点是 1997 年 12 
月）建立的 AR(1)-EGARCH(1.1) 模型.利用所建立的 EGARCH(l.l) 模型，可以 
计算该序列的波动率预测.在预测原点 * = 耶 4, 预测值是心 64 (1) = 6.05 x 10_ 3 , 
村 64 ⑵= R-R2 X 10- 3 , ^ 04 (3) = 5.63 x 10 3 , 屯 (10) = 4.94 x 10- 3 . 这些预测值 
逐步收敛到 (3.29) 式中的“扰动”过程的样木方差 4.37 x 10- 3 . 

3.9 门限 GARCH 模型 

另外一个经常用来处理杠杆效应的波动率模型是门限 GARCH 模型 （或 
TGARCH 模型)，可参见 Glosten, Jagannatlian 和 R»inklc(1993) 以及 Za.koiau(1994). 
—个 TGARCH(m,. 9 ) 模型 假定： 

m m 

of = Qf 0 4 - + 7,7V t _ < )a^_ < 4 -冗 (3.33) 

i=l i=X 

其中 N t ^ 是关于负 a t _, 的指示变董，即 

J 1 ，若 < 0 ， 

八 t—i = \ ^ ^ 

[ 0 , 若 at—i > 0 ， 

〜， 7 , 和达 为非负参数.满足类 似丁- GARCH 模型的条件.从模型中可以看出正的 
a *—* 对疗的贡献为而负的《 4 _纟对疗有更人的贞献（中+ 7 ») a ?_ j , 其中 
7i >0 - 该模型用 0 作为门限来分隔过去扰动的影响.也可以用具他的一些门限值, 
参见第 4 章门限模型的一般 概念. 模型 (3.33) 也称为 GJR 模型，因为 Glosten 等 
人 （1993) 实质上给出了同样的模型. 

作为例子，考虑 IBM 股票从 1926 年到 2003 年的月对数收益率.拟合的 
TGARCH ( 1 , 1 ) 模型 如下： 

r t = 0.012 1 + at, 

al = 3.45 x IO - 4 + (0.065 8 + 0.084 + 0.818 2<r t 2 _ l1 (丄似） 

其中新息服从 GED 分布，所估计的 GED 分布的参数为1.51，标准误差为 0.099. 
均值方程参数估计的标准误差是 0 . 002 , 波动率方程参数估计的标准误差分别是 
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1.26 x 10_ 4 , 0.031 4, 0.039 5 和 0.049. 为检验所拟合的模型，对标准化的残差心有 
Q (12) = 18.34(0.106). 对好有 0(12) = 5.36(0.95). 从而模型对对数收益率的前两 
阶条件矩的建模是充分的.基于所拟合的模型.打杆效应在5%的显著性水平下是 
显著的. 


所用到的 S - Plus 命令 

> ibm.tgarch ^ garch(ibmln-1 , -tgarch(1,1),leverage=T # 

+ cond.dist= # Qed") 

> summary(ibm.tgarch) 

> plot(ibm.tgarch) 

比较为 IBM 股票的对数收益率所建立的 (3.31) 式和 (3.34) 式会发现这两个 
模型是很有意思的.假定= ±2 a t ^, 于是= 士2.由 EGARCH (1, 1) 模型 
可得 

= e° 22X2X0.632 ^ j 264 . 

-1=2) 

另方面.忽略掉常数项 0.000 345,由 TGARCH (1. 1) 模型得 




( rf { e t -i = —2) 一 [(0.065 8 + 0.084 3)4 + 0.818 2] a r 2 _ l 
a ^( e t -i = 2) 、 一 (0.065 8 x 4 + 0.818 2) af_ x 


这两个模型给出了相似的杠杆效应. 


3.10 CHARMA 模型 

人们在文献中已经提出很多其他的经济模型来描述 (3.2) 式中条件方差砟的 
演变.我们介绍一下条件异方差 ARMA ( CI - IARMA ) 模型.此模型是用随机系数来 
产生条件异方差性（见 Tsay (1987)). CHARMA 模型与 ARCH 模型不同，但这两个 
模型有相似的二阶条件性质. CHARMA 模型定义为 

r t = fit -\- at, at = + 4 -- h +r", (3.35) 

其中{屮}是均值为零、方差为吋的高斯白噪声序列 • {&} = {(〜，...是 
—列独立冋分布的随机向量序列，其均值为（)、协方差阵为非负定阵 a 并且 
与{^}独立.本节将用向量与矩阵运算的一些基本性质来简化叙述.读者可以参 
考第 8 章的附录 A . 在此对这些性质作一些简短的回顾.对 m > 0,模型可写成 

a t = in , 

其中 a t _,=(〜_〗，•..， a , 是 a < 的延迟值构成的向量，在 < - 1时刻是已知的. 
从而， (3.35) 式的 CHARMA 模型中 a , 的条件方差为 

4 + Of-iCov (<5/) a 卜 1 = + (at — 1 ， ... ， a<- m ) ^ (at-i» * • * ，〜 _„,)' ， (3.36) 
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记 n 的第 {i,j) 个元素为 U；,,. 因为矩阵是对称的，故= a; 7i . 若 m = 1.则 (3.36) 
式简化为 (^ - ( J % 这是一个 AR . CH ⑴模型.若 m = 2, (3.36) 式变为 

of = -|-a ； na?_i + 2u ； i2at-ta<_2 4- ^22«<-2) 

这不同于 ARCH (2) 模型.因为有交叉乘积项 a ,_, a ,_ 2 .— 般地，若 H 为对角阵，则 
CHARMA ( m ) 模型的条件方差等子一个 ARCH ( m ) 模型的条件方差.因为12是协 
方差阵，它是非负定的，而$是方差、是正的，故我们有4 >0对仟何（成 

立.换句话说，在 CHARMA 模型下 《 r t 2 自动地是正数. 

ARCH 和 CHARMA 模型的明显区别是后者在波动宇方程中有 a t 的延迟值的 
交叉乘积项.这些交叉乘积项在一些应用中会有用.例如，在资产收益率建模中，交 
叉乘积项表示前面的收益率的相互作用.可以想象，股票波动率依赖于这些相互作 
用.然而，交叉乘积项的个数随着阶 m 迅速增加.因此需要某些限制以使模型简单. 
—些可能的限制是在 CHARMA 模型中只用少数交叉乘积项. ARCH 和 CHARMA 
模型的另一个区 别是： 高阶 CHARMA 模型的性质比 ARCH 模型的性质更难得到， 
这是因为处理多元随机变量比较困难. 

作为例子，我们对前面 GABCH 建模已用的 S & P 500 指数的月超额收益率建 
立一个 CHARMA 模型： 

Ti = a t , a t = rfitOi j 4 - S 2t a t 2 + t)t- 

所拟合的模型为 

r t — 0.006 35 + a t . — 0.001 79 4 - ( a t _ i , a t _ 2 ) H ( a t _ l5 a t _ 2 )^ , 

其中 

^ _ 0.141 7 (0.033 3) -0.059 4 (0.036 5) 

-0.059 4 (0.036 5) 0.308 1 (0.034 0) ’ 

括号中的数是标准误差 . 0 的交叉乘积项的 t - 比为 -1.63, 它是在 U )% 的水平下 
边际显著的.如果我们把模型改进为 

r t = 4 >q + a“ a t = Sudt-i + <5 2 ta t _ 2 + S at a t - 3 + r] t , 

但假定‘与 (5 H ,«5 2 t ) 是不相关的，则我们得到的拟合模型为 

rt = 0.006 8 + a t , = 0.001 36 + ( a f \, a t 2 , 3 ) ^ (« t _ i 5 a t _ 2 , ^- 3 )', 

其中 6 的元素及其标准误差（在括号中给出）为 

0.121 2 (0.035 5) -0.062 2 (0.028 3) 0 

n = -0.062 2 (0.028 3) 0.191 3(0.025 4) 0 , 

0 0 0.298 8 (0.042 0) 
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所有的估计值在5%的水平下是显著的.对该模型， a , = r t - 0 .⑻ G 8 是月超额收益 
率与它的平均值的偏离.所拟合的 CHARMA 模铟说明前两个延迟值之间存在某 
种相互作用.实际上，波动率方稈可近似地写成 

n t = U.U01 36 + - ().12ut_i£^_2 + 0.19af— 2 + 0.30ajf_ 3 . 

当 a ,_, a ,_ 2 为负时，条件方差要稍大一些. 

斛释变量的效应 

我们很容易把 CHARMA 模型推广，使得模型中 r , 的波动率依赖于某些解释 
变量.设 {： r 〃} 二 t 是 （ 时刻 Bj 观测的 m 个解释变量.考虑模型 

m 

D =叫 十叫， a t = ^2 (3.37) 

f=l 

其中 屯 = (知，… ，‘)'和％ 是 (3.35) 式中定义的随机向量和随机变量.那么 ，〜 
的条件方差为 

~ + ( 工 1 — 1， • . • ， —J ) n — • • - , 1 〆 • 

在实际应用中，解释变量可能会包含的杲些延迟值. 

3.11 随机系数的自回归模型 

文献中，随机系数自回归 (random coefficient autoregressive , RCA ) 模型是为了 
考虑不问体制间的变化而提出的 • 类似十计量经济学中的面板数据分析 (panel data 
analysis ) 和统计学中的分等级模型 （hierarchical model ). 我们把 RCA 模型当作条 
件异方差模型来阐述，但历史上.它是通过允许参数随时间演变来得到过程的条件 
均值方程的更好 描述. 称时间序列 { n } 服从 RCA ( p ) 模型，如果 { r * t } 满足 

P 

= 00 + ⑷ + 心） r t — +叫， (3.38) 

1=1 

其屮 p 是正整数，= {(〜，•.. ,s pt y} 是一列独立的均值为 0 、协方差阵为 
的随机向量.且与 { a ,} 是独立的.关于该模型的更详细的讨论.参见 Nicholls 
和 Quirm (]982). (3.38) 式中的 RCA 模型的条件均值和条件方差为 

V 

叫 = E ( r * 16 - 1 ) = + of = crl + ( rt - i ^-- , r t - p )fts ( r t _ i , •• - , r t - p )\ 

i—1 

与 CHARMA 模型形式上相同.但 RCA 和 CHAHMA 模型间存在微妙的差 别：对 
HCA 模型，波动率是观察到的延迟值 tvj 的二次函数，向在 CHARMA 模型中.波 
动率是延迟的新息的二次函数. 
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3.12 随机波动率模型 


另一种描述金融时间序列波动率演变的方法是：对〜的条件方差方程引进 
个新息.具体讨论可参见 Melino 和 Turnbull (1990)， Taylor (1994), Harvey . Ruiz 和 
ShopharH(in94), . Tacquier , Poison 和 Rossi (1994). 结果得到的是随机波动率模型. 
与 EGARCTT 模型相似，为了保证条件方差为正的 . SV 模型用 In (^)而不是 
SV 模型定义为 


at — (TtEti — ci\B — ... — a m B m ) In (af) = o ； i) + Vt ， (3.39) 


其中& 独立同分布且服从 AT (0,1), v t 独立同分布且服从 W (0， d )， 且 {e t } 和 {〜} 
是相互独立的， a 0 是常数.多项式1 - f a ,/?* 的所有根的模大于 1. 引进 新息叫 

很大程度地增加了模型的灵活性,但也 Si 卩了参数估计的困难.为了估计 SV 模型， 
我们需要通过 Kalrnan 滤波或者 Monte Carlo 方法来应用伪似然 （ quasi - likelihood ) 
方法. Jacquior , Poison 和 Rossi(1994) 给出了伪似然和 Monte Carlo 马尔可夫链 
( MCMC ) 方法的估计结果之间的比较.估计 SV 模型比较困难是可以想象的.因为 
此模型中用了两个新息 c t 和 a •第12章将讨论一个 MCMC 方法去估计 SV 模 
型.关于随机波动率模型的讨论，请参考 Taylor(1904). 

. lacquier , Pulsmi 和 Russi (1994) 的附录中给出了一■些 SV 模型当 m = 1时的 
性质.例如，当 m ==〗 时， 


In (<r f 2 ) 〜 AT 



為)三 /V ("“)， 


且 E ( a ?) — exp [//,, + 0-2/2], E ( af ) = 3 exp [2"泛 + ，和 corr ( a ?, a ?,,)= 

[exp (( T ^ ai ) l ] / [3 exp ( a ^) — l ]. 限定在一定范围内的经验告诉我们， SV 模型 
常常在模型的拟合上有改进，但在样本以外的波动率预测上与其他模型相比却时好 
时坏. 


3.13 长记忆随机波动率模型 

最近.有人利用分数差分方法.进一步推;•了 sv 模型，允许波动率有长记忆 
性，正如第2章所讨论的，一个时间序列是一个长记忆过程，如果当间隔增加时自 
相关函数以幂函数（而不是以指数速度）衰减.在波动率的研究中引进长记忆模型 
的动机是这样一个 事实： 虽然资产收益率序列本身没有序列相关性，但收益率的绝 
对值或平方序列的自相关函数常常衰减很慢，参见 Ding . Cnmger 和 Engle (1993). 
图 19 所示的是 IBM 股票和 S & P 500 指数从 1962 年 7 月 3 日至 2003 年 12 月 3 1 
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日的日收益率绝对值序列的样本自相关函数.这两个样本 ACF 都是正的，取值大 
小中等,但衰减很慢. 

11.4 
, U.；i 
O 1).2 
< ().1 

- 0.1 

间 w 

( b ) IBM 股栗收益率 

0.4 
„ 0.3 

0.2 

< 0.1 


-U.l 

间隔 

阁 3>9 S & P 500 指数和 IRM 股票 H 对数收益举绝对值序列的样本 ACF , 时间区问是1962年 

7月3日至2003年12月31曰.两个水平虚线表示渐近的5%水平的上.下限 

简单的 K 记忆随机波动率 （ LMSV ) 模型可写成 

a t = (t, =aexp(u t /2), (1 - B) d u t =rjt , (3.40) 

其中 a > 0, c t 独立同分布服从 yV (0, l ), //, 独立同分布服从 AT (0,4) 且和 q 相互 
独立. 0< d < 0.5. 长记忆的特征源 I * 分数差分 （1 - /?)' 它可推出叫的 ACF 以 
¥函数（而不是以指数函数） 衰减. 对模型 (3.40), 我们有 

In (a?) = In (or 2 ) + + In (ef) 

=[in (cr 2 ) + E (lnr?)] + + [In (erf) — (ine^)] | et . 

这样 ， In («?) 序列是一个高斯长记忆过程加上一个非高斯白噪声，见 Breidt , Crato 
和 de Lima (1998). 长记忆随机波动率模型的估计很复杂，但分数差分参数 d 是可以 
用伪最大似然法或回归方法来估计的.对 S & P 500 指数中运用的公司股票的曰收 
益率.取平方后再取对数.利用这样的一些序列， Bollerelev 和 . Iubinski (1999), Ray 
和 Tsay (2000) 发现"的中位数估计约为0.3 8 . Ray 和 Tsay (2000) 以各种不同特征 
对公司进行分类，研究了各类公司股票的日波动率的共同的长记忆成分.他们发现 
同一行业公司会有更趋相同的长记忆成分 （例 如，美国大的国有银行和金融机构). 

3.14 应 用 

本节中，我们运用本章讨论过的波动率模型來研究有实际重要性的一些问题. 
所用数据是从19加年1月至1999年12月的 IBM 股票和 S & P 500 指数的月对数 
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收益率.共有888个观察值，收益率以百分比形式给出并包括了分红.图 3-10 所示 
的是这两个收益率序列的时间阁.沣意到该节的结果都是用 RATS 程序得到的. 


(a) IBM 



m .-Vin IBM 股票和 S&P500 指数月对数收益率的时间图.样本时间段是从 192() 年1月至 
1999年12月.收益率以百分比给出并包括了分红 


例 3.4 我们关心这样的 问题： 是哲一支股票的日波动率在夏季比较低？如果是， 
低多少？对这两个问题疴定的回答在股票期权定价中有实际 意义. 我们用图 3-10 a 
所示的 roM 股票的月对数收益率作为例子来说明怎样回答这两个问题. 

记月对数收益率为给数据拟合一个高斯 GARCH ( U ) 模型： 


Tt = 1.23 十 + at：i at = otEu (3 41) 

of = 3.206 + 0.103 a ?_! + 0.825 crf _ 1 . 

均值方程中的两个参数估计值的标准误差分别为 0.222 和0.037,波动率方程中三 
个参数估计值的标准误差分别为 （).947, 0.021, 0.037. 对标准化的残差屯= a t / a t , 
Ljuiig-Box 统计量为 Q (10) = 7.82 (0.553) 和 Q (20) = 21.22 (0.325). 括弓中为 p 值. 
这样，均值力程的残差没有序列相关性.而对 a t 2 , Q (10) = 2.89(0.98) 和 Q (20) = 
7.26(0.99). 表明标准化残差中无条件异力差性.所拟合的模型似乎是充分的，这个 
模型是进一步研究的出发点. 

为了研究资产波动率的夏季效益，先定义一个示性 变量： 

f 1,若/表示的是六月、七月、八月， 

lit = < 

\ 0,其他， 


并把波动率方程修改为 


<jf = qq 4 -- 4 - + Ut (qtqo -+- ttio«<_i 4 - i ) • 
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这个方程用两个 GARCH (1,1) 模型来描述一个股栗收益率的波 动率： •个模型针 
对夏季的月份，另一个针对剩下的月份•对 IBM 股票的月对数收益率 . a 10 和/3 10 
的估计值在10%的水平下是不显著的，因此我们对方程进行改进，得到 
rt = 1.21 + 0.099 r t _i -f a t , a t = a t et , 

cr'l = 4.539 + 0.113a?，! H- O.SIGofq - 5.154u t . ( 3 . 43 ) 


均值方程中参数估计倌的标准差分别是 0.218 和0.037,波动率方程中参数估计的 
标准差分别是1 .071. 0.022, 0.037 和 1.900. 标准化残差的 Ljung-Box 
统计量的值为 Q (10) = 7.66(0.569) Q (20) = 21.64 (0.302), 因此，在标准化残 
差序列中没有序列相关性.而对吃其 Ljung - Box 统计量为 Q (10) = 3.38(0.97)， 
Q (20) = 6.82 (0.99), 这表明在标准化残差中也没有条件异方差性.改进后的模型看 
起来是充分的. 


比较 (3.41) fP (3.43) 式中的波动率方程，我们会得出如下结论.第一，因为系 
数 5 .1 54 与零显著的不同， p 值为 0.006 7,从而股票波动牟的夏季效应在1%的 
水平下是统计显著的.另外，估计值的负号证实了 IBM 股票月对数收益率的波动 
率在夏季确实 较低. 第二，把 (3.43) 式中波动率模型改写成 




-0.615 + 0.113(, +0.8164^ 若 t 是六月、七月、八月份， 

4.539 +0.1 13^_! + 0.816<7, 2 _ 15 其他， 

负常数项 -0.615 = 4.539 - 5.154 与直观不 一致. 然而，因为 4.539 和 5.154 的标准 


误差相对较大，估计值之差 - 0.(315 可能不佥显著地不同于 0. 为了证实这点，我 
们限制波动率方程中的常数项对夏季月份是0,然后重新拟合模型.利用如下方程 


所拟合模型为 


a t = + + 7(1 ~u t ). 


r L — 1*21 -l- 0.099rf_[ I Ot, (it ^ 

of = 0.114 a 2_ 1 + 0.811a t 2 _, + 4.552 (1 - u t ). (3 44) 

均值方程中参数估计的标准误差分别为 0.219 和 0.038, 波动率方程中参数估计 
的标准误差分别为 0.022, 0.03 4 和 1.094. 标准化残差心的 Ljung - Box 统计量 
为 Q (10) = 7.68 和 Q (20) = 21.(37,好的 Ljung-Box 统计量为 Q (10) = 3.17 和 
Q ( 2 °) = 6.85. 检验统计量的这些值与前面得到的值很靠近，在5%水平下都是不 
显著的. 

(3-44) 式的波动率可用来评价夏季效应在 IBM 股票波动率卜的体现作为说 
明， 基于 （ 3 .4 旬 式，对 1999 年的 IBM 月对数收益率来说, < 和 < 的中位数分别是 
29,4 和 75.1. 利用这些值，我 们有： 对夏季月份 4 = 0.114 x 29.4+0.811x75.1- 64.3, 
对其他月份 of = 68.8. 这两个波动率之比为 64.3/68.8 « 93%. 也就是说，在夏季 
月份 IBM 股票的月对数收益率的波动率减小 7%. 
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例 3.5 S&P500 指数在衍生产品市场上被广泛应用，因此对它的波动率建模是一 

个研究热点.此例中，我们所问的问 题是： 组成 S&P500 指数的单个股票过去的收 
益率刘该指数现在的波动率建模是否有影响？这个问题的详细研究超出了本章的 
范围，这里我们仅用 IBM 股票过去的收益率作为解释变量来说明•下这个问题 • 

数据如图 3-10 所示. S&P. r j00 指数的月收益率序列记为 n. 利用 n 和高斯 
GARCH 模型，我们得到如下特殊的 GARCH(2J) 模型 

r t = 0.609 + at , a * = ( TtEt , ci \ — 0.717 -f 0.147 a {_ 2 -( - 0.839 crt _ i . (3.45) 

均值方程中常数项的标准误差为 0.138, 波动率方程中参数的标准误差分别为 0.214. 
0.021 和 0.017. 基于标准化残差心= at/ot. 我们有 Q(10) = 11.51 (0.32), Q (20) = 
23.71 (0.26), 括号内为 p 值 •对咚 Q(10) = 9.42 (0.49), Q (20) = 13.01 (0.88). 从而， 
在 5% 的水平下.模型是充分的. 

使用 IBM 股票作为 S&P500 指数的成分，下面我们评价其过去的收益率对 
S&P500 指数波动率建模的影响.作为-个简单的说明.我们把波动率方程修改为 

<j\ = «o + a：2af_ 2 + pi 1 + 7 (^t-i — 1-24) 2 ， 

其中： t, 是 IBM 股票的月对数收益率 . 1.24 是 a 的样本均值.对 r, 拟合的模型 
变为 


r t = 0.616 + a t , a t = a t e t , ^ 4fJ ) 

af = 1. U 69 4 - 0.148 af _ 2 + 0.834^^ - 0.007 ( A—i - 1.24) 2 . 

均值方程中参数估计的标准误差为 H 130. 波动率方稈中各参数估计的标准误差分 
别为 0.271. 0.020, 0.018 和 0.002. 关于模型的检验，对标准化残差屯= n ， t /( T t , 
Q (10) = 11.39 (0.33), Q (20) = 23.63 (0.26), 而对5 ?， Q (10) = 9.35(0.50), Q (20)= 
13.51 (0.85). 因此,此模型是充分的. 

因为检验7 = 0的/，值为0.0() 3 9,所以延迟间隔为1的 IBM 股票收益率对 
S & P 500 指数波动率的影响在1%的水平下是显 著的. 系数的符号是负的，这一点 
是可以理解的.这意味着延迟间隔为1的 IBM 股票的收益率能减小 S & P 50 U 指数 
波动牟.表 3-4 给出了利用 （3.45) 和 (3.46) 式的模型给从1999年7月至 I 2 月的 
S & P 500 指数拟合的波动率模型.从表中可看出， IBM 股票对数收益率的过去值对 
S & P 500 指数波动率确实有影响. 

表14 用带和不带 IBM 过去对数收益竿的模型拟合的 S ^ PROn 指数从19 9 9年7月至 


12月的月对数收益率的波动率 


n 

7/99 

8/09 

0/9?) 

10/99 

11/99 

12/99 

槙艰 (3.4S) 

模型 (3.46) 

26.30 

23.32 

26.01 

23.13 

24.73 

22.46 

21.69 

20.00 

20.71 

19.45 

22.46 

18.27 
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3.15 其他方法 

本节考虑两种其他的波动率建模方法. 

3.15.1 高频数据的应用 

French, Schwert 和 Stambaugh(1987) 考虑了另一种估计波动率的方法.他们用 
髙频数据上计算低频收益率的波动率.近年來.这种方法已经有了一些吸引力，因为 
尚频金融数据越来越容易获得（参见 Andersen. Bollerslev. Diebold 和 Labys(2001a, 
b)). 

假设我们对某资产的月波动率感兴趣.并且我们可以获得该资产的日收益率. 
令 rr 1 是该资产的第 （ 个月的月对数收益率.同时假设第 < 个月有 n 个交易日，这 
个月中的 U 对数收益率为利用对数收益率的性质.我们有 

n 

r r = E 

假设条件方差和协方差存在，则 

n 

Var (r； f * \F t ^ ) = [ Var (〜 ) + 2 [ Cov [(r M ,r t>i ) IF^j. (3.47) 

<=1 i<j 

其中 ! 是第 / — 1 个月已知的信息.如果添加另外的假定，上式可以简化.例如， 
若假定 {r M } 是白噪声序列，则 

Var |^_ 1 ) = nVar (r t ， i ) ， 

其中 Vm ( r til ) 可以用口收益率 { r M }7 =1 估汁 出来： 

(nm) 2 , 

从而，月 


(3.48) 

若 { r M } 服从一个 MA (1) 模型，则 

Var ( r f m | F t _ i ) = nVar ( r t . i ) + 2 (n - 1) Cov ( r t<l , r ti2 ), 


其中 h 是第 f 个月中的日对数收益率的样本均值即 
波动率的估计为 n ，=1 

t = 1 


它的估计可由下式 给出: 
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a m = H 一尸 t) 2 + 2 Z ( r M — ft ) ( r t)i+ , - ft ). (3.49) 

4=1 t=l 

上述波动率估计的方法很简单，但在实际应用中会遇到一些困难.第一，对口 
收益率 { r f ,,} 的模型是未知的，这就使 (3.47) 式中协方差的估计复杂化了.第二, 
每个月大约21个交易口，是个小样本.这就使 (3.47) 式中方差和协方差的估计的 
精确性值得怀疑.估 II 的精确性取决于 { r M } 的动态结构和它的分布.若日到数收 
益率有较高的超额峰度和较强的序列相关性，则 （3.48) 和 (3.49) 式屮的样本佔计 
( r ' f n 甚至是不相合的（参见 Bai , Russell 和 Tiao (2004)). 为了使这种方法更有实用 
价值，还需要更进一步的研宄. 

例 3.6 考虑 S & P 500 指数的对数收益率的月波动率，时间是从1980年1月至 
1999年12月.我们用三种方法来计算波动率.第一种方法，用日对数收益率和 
(3.48) 式（即假定日对数收益率是白噪声序列).第二种方法.用日对数收益率但假 
定一个 MA (1) 模型（即用 （3.49) 式). 第三种方法是对1962年1月至19的年12 
月的月收益率拟合一个 GARCH (1, 1) 模型.我们使用更长的时间段是为了得到更 
精确的月波动率估计.所用的 GARCH (1, 1 ) 模型为 

i-y 1 = 0.G58 + u t , at = (Ttt：ty Of = 3.349 十 0.086(^4+ 0.735cr ^_ 1； 

其中 Q 是标准高斯白噪声序列.图 3-11 所示的是估计出的月波动率，我们清楚地 


30 

6 () 

41) 

运 2U 
0 


m : i-n S & P 500 指数对数收益率的月波动率估计值的时间图，时间范围是1980年1月至 
1999年12月： （ a ) 假定日对数收益率是白噪声序列： （ b ) 假设日对数收益率服从 
MA (1) 模型； （ c ) 利用从1962年1月至1999年12月的月收益率和 GARCH ( l . l ) 
模型 
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看到基于日收益率的波动率估计值要比基于月收益率和 GARCH ( U ) 模型的波动 
率估计值大许多.特别地，当使用日收益率时，1987年10月的波动率估计值大约 
为 680. 而为了三个图有相同的尺度范围，我们对它们进行了截断. 

在 (3.48) 式中，如果我们进一步假定6的样本均值是0,则我们有 al « ± r ?,. 

i=l ’ 

这时，一个月中曰对数收益率的累积平力和就可以作为月波动率的估计.这个概念 
已经推到用某项资产的夂易日内的对数收益率米估计日波动举.设 TV 表示某项 

资产的对数收益率.假定可以得到等间隔的交易日的对数收益率满足 =± r M . 

»=i 

称暈 

»=1 

为/’，的已实现波动率.参见 Andersen 等 (2001 a ? b ). 从数学上来讲，已实现波动率 
是 O 的一次变差，并且假定 { o .,} r = i 是均值为 U , 力差为有限的独立同分介随机变 
量序列.限定在一定范围内的经验表明. \ n ( RV t ) 通常近似地服从高斯 ARIMA (0, 1, 
q) 模型.该模型可以用来进行预测.更多的信息参见 11.1 节. 

已实现波动率的优点包括其简单性以及用到 了交易 日内的收益率.直观上讲， 
人们喜欢尽可能地选择大的〃以便用到更多的信息.然而，当，^之间的时间间隔 
很小时，收益率将受到市场微观结构的约束（例如买卖价格弹性).这经常会导致波 
动亨-的有偏估计.在构建已实现波动率时如何选择最优的时间间隔近来已经吸引了 
很多人去研究.美国交易比较频繁的资产通常用3〜15分钟的时间间隔.对股票收 
益率应用已实现波动率的另外一个重要问题是如何处理隔夜的收益率.即从第 （-1 
天的收盘价到第/天的开盘价之间的收益.忽略隔夜收益率会严重低估波动率.另 
一方而，一定范闱内的经验告诉我们，对于指数收益率和外汇收益率而言 t 隔夜收 
益率很小. 

在一系列最近的文章中 ， Barndorff Nielsen 和 Shcphurd (2004) 已经用资产的高 
频收益率来研究资产收益率的双幂变化，并提出了一些方法來检测波动率中的跳 
跃. 

3.15.2 日开盘价、最高价、最低价和收盘价的应用 

对于许多资产，日开盘价、最高价、最低价和收盘价都可以得到. PHlkhl - 
bou(1!)80), Carman 和 Kliv ^ atlOSO ), Rogers 和 Satchell (1991) 以及 Yaug 和 Zhaa ^(2000) 
的研究表明可以用这些信息来改进对波动率的估计.图: M 2 给出了第 （ 个交易日 
价格对时间的时间图.这里假定时间是连续的.对丁一项资产 T 定义如下 变量： 

• C t =笫 t 个交易日的收 盘价； 

• =第 f 个夂易日的开 盘价； 

• / = 一天内结束交易的 分数； 
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• 仏=第^个交易日的最 高价： 

• “ =第£个交易日的最 低价； 

• F t ^ =第 * - 1时刻所有的已知信息. 

交易收盘 交易丌盘 

35 
34 
33 
32 
31 
30 

图 3-12 价格对时间的时 问图： 价格的规模是任意的 



0.0 0.2 ().4 0 .G 0.8 1.() 

/ 

时间 


常规的方差（或波动率）是 crfsEKCV - Ct - WlG - i ]. Garrnan 和 Klass (1980) 
考虑了 W 的几种估计，他们假定价格服从一个不带漂移的扩散过程（关于随机扩 
散过程的更多信息参见第6章).他们考虑的估计 包括： 


( O t - C t - i) 2 [ C t - O t ) 2 
2 / 2(1-/) ’ 

^ 0360 7{Ht - Lt)2 * 


0 </< l ; 


xot-ct-iy 


+ 0.83 


(H t -L t y 


0 </< 1 ; 


a ， 1 f (1-/)4 ln (2)， 

o\ t — 0.5 (故- L t ) 2 - [2 ln (2) — l](Ct — O t ) 2 , which is w 0.5( 执 - L t ] 2 
— 0.386 (Ct — 0() 2 ; 

cr\ t = 0.12 + 0.88-^j, 0 < / < 1. 


-r 


他们还考虑 / 吏精确但史为复杂的估计 al t , 然而该估计与砟 j 很靠近.定义波动 
率估计的效率因子为 


m^lt) = 


Var(0 


Gannan 和 Klass (1980) 发现.对于所考虑的简单扩散模型，当* = 1，2, 3, 5, 6时， 
Eff ( oJ t ) 分别近似为2, 5.2, 6.2, 7.4 和 8.4. 注意 Parkinson (1980) 推导出了 / = 0 
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时的 

定1如下 变量： 

• o t = ln (0<) - ln ( C 7 t - i ), 标准化开盘价； 

• Ut = \ n ( H t ) — ln ( Ot ). 标准化最高价： 

• d t = ln ( L t ) - ln (0,), 标准化最低价： 

• c t = ln ( C t ) - ln (0,), 标准化收盘价. 

假定可以得到 n 天的数据，并日波动率在一段时期内为常数. Yan K 和 Zhang (2000) 
建议用下面的估计作为波动率的稳健 估计： 

^lz = +(! - k )^ 

其中 

& c = - 

n 1 t=i n t=i 

1 ^ 

^rs — ~ y^[ w *( w t — Ct) + d-t{dt — Ct)], 

_034_ 

1.34 + (n + l)/(n — 1) 

估计由 Rogers 和 Satchcll (1991) 提出，选择 fc 使得佔计的方差最小，其屮 
a 2 vz 是三种估计的线性组合. 

称童 H t — L t 为第 /. 大价格变化的范围.该估计导致/基于价格变化范围的波 
动率估计，可参见，例如 Alizadeh , Brandt 和 Diebold (2002). 在实际中.股票价格只 
在离散时间点上可观测到.同样地，观测到的最高价格可能比低，而观测到的 
最低价格可能比 M 高.因此，观测到的日价格范围可能会导致低估真实的价格范 
围，从而可能导致对波动率的低估.波动率估计中的偏差依赖于交易频率和股票的 
微小记录间隔.对于交易很密集的股票，可以忽略偏差.对于其他股票，则需要进一 
步的研究来更好地理解基于价格范围的波动率估计的表现好坏. 

3.16 GARCH 模型的峰度 

波动率估计中的不确定性是一个重要的问题.但它经常被忽视.为了评估被估 
波动率的易变性，人们必须考虑波动率模型的峰度.本节导出了 GARCH (1,1) 模型 
的超额峰度.同样的思想可应用到其他 GARCH 模型中.所考虑的模型为 


a t = a t e u of =tt 0 + -f (haj 一 u 
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其中0! 0 > 0,⑴^ 0, ^ 0, a ! +/3 i < 1, { e ,} 是独立同分布序列，满足 

Ee t = 0, Var(e t ) = l, E (#) - + 3 ， 

其中 / C f 是的超额峰度.基于以上假设，我们有 

• Var (o t ) = E (erf) = a 0 / [1 - (qj 

• E{aj) = (K E + 3) E ( W ), 只要 是存在的. 

在波动率的模型两边取平方，有 


^ 4 十 1 十 /??<r t 4 _ 1 + 20^141^+ 2ao/?ia?_, + 2a 1 ^ 1 af_ 1 a?_ 1 . 


再两边取期望并利用前面所述的性质，我们有 


E W ) 


_ Qq (1 十 Q：i + 仇 ) _ 

11 一 (《i +A)] [l-af(K t - + 2 )- (叫 + ft) 2 


只要 1 ：> 叫 + 汍 > 0 且 1 - ( AT e - f 2)-( u ! 十汍 ) 2 > 0 .若 a t 的超额峰度 存在， 
则它是 

E (af) (AV + 3) 1— (0^ 十 /?1) 2 


K a 


3 


3. 


PMf 2a? ( n i + ^ f - K £ oi 

此超额峰度能写成一个非常有启发性的式子.首先，考虑&是正态分布的情 
形.在这个情形下. 1< € = 0,并且通过简单的代数运算可得 


1 一 2ar〒 — (oj + /?i) 2 

其屮上角标 （ g) 用来表示髙斯分布.这个结果有两个重要 推论： （ a ) 若 1 - - 

(⑴ + 汍 ) 2 > 0, 则 a t 的峰度存在 ； （ b) 若 m = 0, 则 K ( a 9) = 0, 意味着对应的 
GARCH(l.l) 模型没有厚尾. 

其次，考虑^不是高斯分布的情形.利用前面的结果，我们有 


/vTff - (qi 4* / 3 \) -4 - + 3A r o^ 

l-2^-(rv 1 +/? 1 ) 2 - 


A ? 1 — 2 dj — (qj + fi \ ) 2 + ( ia ：2 + ^ K e n \ 
1 — — (qi + ^i) 2 — K e a\ 


K s + K { a 9) + Id 
1 - ^ K e K ^ ] 


这个结果最初由 George C . Tiao 得到（参见 Bai , Russell 和 Tmo (2003)), 它对所冇 
存在峰度的 GARCH 模型成立.例如，当达= 0时，模型退化为 ARC 1 I (1) 模型 T 这 
时只要< 1，则 K ( a a) - 6 a ?/ (1 - 3(4)，并且 《 t 的超额峰度为 


( K e + 3) (l - Qj ) K c -f 2 K e a \ + 

l-{K e + 3)^f ' = 1 — 3 q2 - K e n 2 { 
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K e (\- 3 q ?) + 6 a ； 4- 5 iC e a ； = K e + K ( a 9) + ^ K £ K { a 9) 

— l-3a?-K e a ； _ 1 - lK e K { a 9) • 

上述结果表 明：对 GARCH ( l . l ) 模型来说.系数 m 在决定~的尾部行为时 
起关键作用.若⑴= 0,则 Ki 9) = 0且 AT a = 这时〜的尾部行为与标准化噪 
声的尾部行为相似.若《, > 0,则 Ki 9) > 0, a , 过程有厚尾性. 

对一个（标准化的）自由度为 v 的学生分布，若 v > 4 ,我们有 E (4) = 
6/ ( v -4) + 3. 因此，对 I ； > 4, e t 的超额峰度为 A ) = 6/ (v - 4). 这就是本章中3学 
生 - t 分布的自由度事先给定时我们使用4的部分原因.只要 
(ax 十历 ) 2 > 0,则 a t 的超额峰度变为 /( a — [6 + (v + 1) K ( a a) j / [ t ; - 4 - 

附录波动率模型估计中的一些 RATS 程序 

在实例说明过程中所用的数据文件是 “ sp 500. txt ”， 该文件中包含的是 S & P 500 
指数的超额收益率，共792个观察值. RATS 程序中的注释前面带 * 号. 

A 带常数均值方程的高斯 GARCH (1,1) 模型 

all 0 792:1 

open data sp500.txt 
data(org=uba) / rt 

*** initialize the conditional variance function 
set h = 0.0 

*** specify the parameters of the model 
nonlin mu aO al bl 
*** specify the mean equation 
frml at = rt(t)-mu 

*** specify the volatility equation 
frml gvar “ a0+al*at(t-1) 十 bl*h(t-1 〉 

*** specify the loq likelihood function 

frml garchln = -0•5*log(h(t)=gvar(t))-0•5*at(t)**2/h(t} 

“* sample period used in estimation 
Qmpl 2 792 

*** initial estimates 

compute aO = 0.01, al = 0.1, bl = 0.5, mu = 0.1 

maximize(method=bhhh,recursive,iterations=150) garchln 

set fv = gvar(t) 

set resid = at(t)/sqrt(fv(t)) 

set residsq = resid(t)*resid(t) 

*** Checking standardized residuals 
cor(qstats,number=20,span^lO) resid 
*** Checking squared standardized residuals 
cor(qstats,number=20,span=10) residsq 

B 带学生分布新息的 GARCH (1,1) 模型 

all 0 792:1 

open data sp500.txt 



130 第 3 章条件异方差模型 


data(org=obs) / rt 
set h = 0 . 0 
nonlin mu aO al bl v 
frml at = rt(t)-mu 

f rml yvar = dO-t-al *aL (t-1) A *2^bl*h ( L -1) 
frml tt = at(t)**2/(h(t)=gvar(t)) 

frml tin * %LNGAMMA((v^l) / 2 .) -%LNGAMMA(v/2.)-0.5*log(v-2.) 
frml gin * tin- ( (v-fl) /2 .) *log (1.0-htt (t) / (v-2.0))-0.5*log (h (t)) 

Ginpl 2 792 

compute aO = 0.01, al = 0.1, bl = 0.5, mu = 0.1, v = 10 

maximize(method=bhhh # recursive,iterations=150) gin 

set fv = gvar(t) 

set reaid s at (t:) /sqrt (fv(t)) 

set residsq = resid(t)*resid(t) 

cor(qstats,number=20,span=10) resid 

cor(qstats , number=20,span=10) residsq 

C 对 IBM 股票月对数收益率的 AR (1)- EGARCH (1, 1) 模型 

all 0 864:1 

open data m-ibin. LxL 
data(org=obs) / rt 
set h =» 0.0 

nonlin cO pi th ga aO al 

frml at ■ rt(t)-cO pl^rt(t-1) 

frml epai = at(t)/(sqrt(exp(h(t)))) 

frml g = th*epsi(t)+ga*(abs(epsi(t))-sqrt(2./%PI)) 

frml gvar = a 丄會 h(t-1) 十 (l-al)*aO+g(t-1) 

frml garchln = -0•5*(h(t>-gvar(t>)-0•5*epsi(t>**2 

smpl 3 864 

compute cO * 0.01, pi = 0.01, th = 0.1, ga = 0.1 
compute aO = 0.01, dl = 0.5 

maximize(method=bhhh,recursive,iterations=150) garchln 

set fv * gvar(t) 

set resid = epsi(t) 

set residsq = reaid(t)^resid(t) 

cor(qstats,number=20,span=10) resid 

cor(qstats,number=20,span=10) residsq 

练习题 

3.1 对 GARCH (1.2) 模型，导出以 /». 为预测原点的向前多步预测公式. 

3.2 对 GARCH (2,1) 模型，导出以 h 为预测原点的向前多步预测公式. 

3.3 假定 n , … ， n , 是来自于服从如下 AR (1)-(; ARCH (1，1) 模型的收益率序列的观 察值: r , = 
/i + 0 ir f _j + a t , a t — a t e t , cr ? = a 0 + aia?_t 0 ' cr ’ f-u 其中 £t 是标准的高斯白噪声. 
导出这组数据的条件对数似然函数. 

3.4 在上题中，假定服从自由度为 u 的标准化的学生 -/ 分布.镑出数据的条件对数似然函 
数. 

3.5 考虑 Intel 股票从1973年至2003年的月简弟收益率.数据包含在文件 li m - intc 7303. txt " 
中.将收益串转换为对数收益率.对转换后的序列逑立个 GARCH 模型并汁算以2003 
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年12月为预测原点的向前1步至5步的波动率预测值. 

3.6 文件 •' m - mrk . dat ” 包含了 Merck 股票从1946年6月到2003年12月的月简单收益率， 

有 两列： 日期和月简单收益率.把简单收益率变换成对数收益率. 

( a ) 对数收益率中有没存明显的序列相关性？用自相关系数和5%的显著性水 f •来回答该 
问题.如果有，则移除序列相关性. 

( b ) 此对数收益率存在 ARCH 效应吗？如果 （ a ) 部分屮有序列相关性，则该部分用其残 
差序列•用 Ljung - Box 统计既 对收益率平方（或残差的平方）的6个间隔和12个 
间隔的白相关系数，在5%的显著水平下冋答该问题. 

( c ) 对数据识别一个 ARCH 模哦.然后给数据拟合被识別的模型，写出所拟合的模型. 

3.7 文件 3 m 4603. txt ” 包括两列，分别是 3 M 公司股票的 R 期和月简单收益率把收益率 

变换成对数收益率. 

( a ) 对数收益宇•存在 ARCH 效应吗？用6个间隔和12个间隔的 自相关 系数所构成的 
Ljung - Box 统汁贵，在5%的显著水平下回答该问题. 

( b ) 用收益率平方的 PACF 识别一个 ARCH 模型.所拟合的模型是什么？ 

( c ) 共有695个数据点.利用前690个观测重新拟合模型，并利用所拟合的模型来预测 
/ = 691到 A = (595 时的波动率（预测原点为 /I = 690). 

( d ) 对 3 M 股票的对数收益率建立一个 ARCH - M 模型.在5%的显著水 f •下检验风险 
溢价为 （） 的假设，得出你的结论. 

( e ) 利用刖 byu 个观测对 31 V 1 股票的对数收益丰•建立一个 EGARCH 模型.利用所建模 
型计算以 /I = 690为预测原点的甸前1步到闷削5步的波动举预测. 

3.8 文件 * l m - gnisp 5003 .txf 包含日期以及 General Motors 股票和 S & P 500 指数从19邡年 

至1999年的月对数收益率. 

( a > 给 GM 股票对数收益率建立一个带髙斯新息的 CARCH 模型. 检验模型并写出烺后 
所拟合的模型. 

( b ) 给 GM 股票的对数收益宰违立一个带高斯新息的 GARCH - M 模铟. 所拟合的模® 
是什么？ 

( c ) 给 GM 股票的对数收益率建4—个带学生4分布新息的 GARCH 模型，估计出自 
由度并写出 M 后拟合的模型.设 W 是学生 -< 分布的自由度，在5%的显著水平 F 检 
验假设// 0 : v = 6对队 ： v / 6. 

( d ) 给 GM 股票的对数收益串建立一个 EGARCH 模型.所拟合的模型是什么？ 

( e ) 利用对 GM 股票的对数收益率所拟合的所有波动率模型进行向前1步到向前6步预 
测，并进行比较. 

3.9 冉考虑文件 * m - gm S p 5003. txt ” 中的 GM 股票. 为序列建立一个充分的 TGARCH 模型. 

写出所拟 介的模 型并进行杠朴效应的 M 著性检验.给出向前1步到向前 G 步预测. 

3.10 再次考虑文件 in - gmsp 5003. txf ' 中的收益率. 

( a ) 对 S & P 500 指数的月对数收益串建立一个髙斯 GARCH 模型.仔细检验模型. 

( b ) 在该指数收益率的波动率 中疗在 夏季效应吗？利用上小题中所建立的 GARCII 模型 
来回答， 

( c ) GM 股票的延迟收益率在该指数波动率建模中有用吗？利用本题中 （ a ) 所建的 GARCH 
模型作为基础模型来比较. 
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3.11 文件 “ d - gmsp 9303. txt ” 包含了 GM 股票和 S & P 500 复合指数从1993到2003的日简 
笮收益率，有三列，分别是日期、 GM 股票收益率和 SP 收益率. 

( a ) 计算 GM 股票的日对数收益率.对数收益宰中存在 ARCH 效应吗 V 你 吋以用 平方收 
益率的10个延迟值和5%的显著性水平进行检验. 

( b ) 计 算平方 收益率序列的 PACF (10 个 ㈣ 隔以内的 )• 

( c ) 给 GM 对数收益串拟合一个商斯 GARCH 模型.进行检验，并写出所拟合的模型. 

( d ) 给序列建立一个带广义误差分布新息的 GARCH 模型，写出所拟合的模型. 

3.12 考虑文件 “ d - gmsp 9303. txt ” 中的 S & P 500 复合指数的日简单收益率. 

( a ) 该简单收益率中存在 ARCH 效应吗？你可以用甲方收益率的10个延迟值和5%的 
显菩性水平进行检验. 

( b ) 为简单收益率序列建， V •—个充分的 GARCH 模型. 

( c ) 根据所拟合的模型计算简单收益率序列及其波动率的向前1步到向前4步预测. 

3.13 再次考虑文件 “ d - Rmsp 9303. txt ” 中 GM 股票的口简单收益率. 

( a ) 为序列拟合一个充分的 GARCH - M 模型，并写出该模型. 

( b ) 为序列拟合一个充分的 EGARCH 模型.杠杆效应在5%的 M 著性水平下显著吗？ 
3.14 再次访问文件 “ d - gmsp 9303. txt ”. 然而，我们将研究市场波动率在单个股票波动率建模 

中的意义.将这两个收益率转换为对数收益率，并以百分比形式给出. 

( a ) 为对数 S & P 5 UU 收益率建立一个带广义误差分布的 AR (5)- GARCH (1，1) 模瑣. AR (5) 
模型中只包含延迟为3和5的值.用 “ spvol ” 表示所拟合的波动率序列. 

( b ) 把 “ spvol ” 作为外生变®为对数 GM 收益率序列建立一个 C , ARCH (1, 1) 模型，检 
验模型的充分性，并写出所拟合的模型.在 S ^ Plm ? 屮，命令为 

fit = garch(gm 〜 1, 〜 garchd, 1) 十 spvol, cond.dlst= 1 ged*) 

( c ) 讨论所拟合模型的意义. 

3.15 仍像以前那样考虑 GM 股票和 S & P 500 指数从1993年到2003年的日对数收益率的& 
分比.但我们研究 GM 股票的波动举对 S & P 500 指数波动率的建模有没有贡献.采取以 
下步骤进行 分析： 

( a ) 给 GM 股票对数收益率的百分比拟合一个带广义误差分布的 GARCH 0, 1) 模型. 
拟合的波动率用 “ gmvol ” 表示.将 “ gmvol ” 作为外生变量为 S & P 500 指数的对数收 
益率拟合一个充分的 GARCH 模型.将所拟合的模型写出来. 

( b ) 在为 S & P 500 指数收益宰•波动率的建模中， GM 股票收益率的波动宰有用吗？为什 
么？ 
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第 4 章非线性模型及其应用 


木章主要讨论金融数据中的 t 线性问题和金融时间序列分析中有用的非线性 
经济计量模型.考虑-元时间序列为简笮起见.假定观察的 时间间 隔是等距的. 
记 { x t \t = 1,--- ，: H 为观察值， r 是样本容量.如第2章中所述，一个纯随机的时间 
序列称为线性的，如果它能表示成 

oo 

=綷十 E (4.1) 

其中^是常数，粍=1，叭是实数，{叫}是独立同分布的随机变量序列，它们共同 
的分布函数是合理定 义的. 假定的分布是连续的且 E ( a t ) = 0. 在许多场合下， 
我们进一步假定 Var ( a t ) = a \, 更进一步地，是高斯的•若 a 〗 g 衅 < 00 ,则心 

是弱平稳的（也即 a 的前两阶矩不随时间变化).第2章中 ARMA 过程是线性的， 
因为它有形如 (4.1) 式的 MA 表示.任何不能表示成 (4.1) 式的随机过程称为是非 
线 性的. 这个非线性的定义是针对纯随机的时间序列.人们可以拓展这个定义，允 
许: r f 的均值是一些外生变量的线性函数，这些外生变量包括时间指标和某些周期 
函数.但这样的均值函数很容易用第2章中介绍的方法束处理，我们在此不作 L 寸论. 
从数学上讲，的个纯随机时间序列模型是由现在和过去的“扰动”所构成的独 
立冋分布序列的一个函数： 


Xt = (4.2) 

当 /(•) 是其自变量的线性函数时，则: r t 就是 (4.1) 式中的线性模型. /(.) 中的任何 
非线性性都会导致一个非线性模型.不能直接应用一般的非线性模型 (4.2), 因为它 
包含了太多的参数. 

为了把文献中可见到的非线性模型放在一个合适的框架中，我们把 a 的模_ 
写成它的条件矩的形式•设是由/ -1时刻已有信息产生的 (7 -域.典型的 
是由 r t _ 2 ，...} 和 } 中的元素线性组合而成的.给定 F t _!, x t 
的条件均值和条件方差分别是 

ht = E(x t |F t _!) = <r t 2 = VarCardFt-!) = /iCFt-i), (4.3) 

其中 g (.) 和/ ^(.) 是有意义的函数， / i (.) > 0. 这样，我们把模型限制为 


+ s/h{F\~C)Eu 
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其中= a ,/ G t 是标准化的“扰动”(或新息).对 (4.1) 式中的线性序列 x ,, 火 .） 是 
F ,_, 中元素的线性函数 = 

非线性模型的发展就在于 (4.3) 式中的两个方程的扩展.若 .(/(.) 是非线性的， 
则 x , 称为是均值非线 性的; 若/^(.)是时变的，则: r , 是方差非线性的.第3章的条 
件异方差模型都是方差非线性的，因为它们的条件方差随时间变化.事实上，除了 
GARCH - M 模沏中从依赖于从而随时间变化外，第3章中所有其他的波动率 
模型都着眼于 (4.3) 式中条件方差方程的扩展或修改.基干熟知的 Wold 分解.一个 
弱平稳的、纯随机的时间序列能表示成不相关的 “ 扰动”的一个线性函数.对于平 
稳波动率序列.“扰动”互不相关，但不独立.木章讨论的模型是另一种向非线性的 
扩肢.这种非线性性由对 (4.3) 式中的条件均值方程的改动或扩展引起. 

统计学文献中已提出了许多非线性时间序列模型，如 Granger Andersen 
(1978) 的双线性模型 (bilinear model ), Tong (1978) 的门限自回归 ( tlu-esliold autore ¬ 
gressive , TAR ) 模型 . Priestley (1980) 的状态相依 ( state - dependant ) 模型和 Hamil ¬ 
ton (1989) 的马尔可夫转移 (Markov switcliing ) 模型.这些非线性模型的基本思想 
都是让条件均值函数^按简单的参数非线性函数随时间演变.近来，利用计算设备 
和计算方法上的进展，人们提出/一些新的非线性模型.这些扩胺模型包括 Carlin , 
Poison 和 Stotfcr (1992) 的非线性状态空间建模， Chen 和 Tsay (1993 a ) 的泛函系数 
自回归模型， Chei 】 和 Tsay (1993 b ) 的非线性可加自回归模型以及 Lewis 和 Stevens 
(1991) 的多元适应回归样条.这些扩展的基本思想或者用模拟方法来描述^条件 
分布的演变或者用数据驱动 ( data - driven ) 方法来探索一个序列的非线性特征.最 
后.非参数和半参数方法，如核回归和人工神经网络，已经被用来探索时间序列中 
的非线性性 . 4.1 节将讨论一些可应用到金融时间序列分析上的非线性模型.包括 
一些非参数和半参数方法. 

除了各种非线性模型的发展，人们还对能区分线性序列和非线性序列的检验统 
计量的研究感兴趣现在可用的检验方法中既有参数检验又有非参数检验.大多数 
参数检验是利用拉格朗日乘子法或似然比统计量.非参数检验依赖于: r t 的高阶谱 
或依赖于针对混沌时间序列发展起来的维数相关系数 . 4.2 节将介绍一些非线性检 
验 方法； 4.3 节和 4.4 节讨论非线性模型的建模与 预测； 最后， 4.5 节给出了非线性 
模型的应用. 


4.1 非线性模型 


统计文献中发展起来的大多数非线性模型都是针对 (4.3) 式中的均值方程的. 
具体可参见 Priestley (1988) 和 Tou S (1990) 中关 T 非线性模型的综述.这里，我们 
的0的是介绍一些能用到金融时间序列上的非线性模型. 
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4.1.1 双线性模型 

(4.1) 式的线性模型只是 (4.2) 式的函数 /(.) 的一阶 Taylor 展开.这样，向非 
线性扩展的一个自然的推广就是使用这个展开的二阶项末改进逼近.这就是双线性 
模型的基本想法.双线性模型可以定义为 

P q m 9 

X t = c + ^2 + 5 二 + °t» (4.4) 

ts=l J=1 i=l 

其中 p ， g，m 和 s 是非负整数.这个模型由 Granger 和 Andersen (1978) 提出，并得 
到厂广泛 研究. Subba Rao 和 Gabr (1984) 讨论了这个模型的一些性质和应用， Liu 
和 Brockwell (1988) 研究了一般的双线性模型.双线性模型的性质（如平稳性条件) 
通常通过两个步骤导出 ： （ a) 把模型写成状态空间 形式; （ b) 利用状态转移方程把状 
态表示成过去的新息与随机系数向量的乘积. (4.4) 式中的双线性模型的特殊推广 
形式是有条件异方差性的.例如.考虑模型 


Xi = H + Pi a t-t a t i 


其中 { fl ,} 是一个白噪声序列 . X ,的前两阶条件矩为 


| f t - 1 ) = 


Vor^elF,-,) = 



(4-5) 


这与第 3 章中的随机系数自回归 ( RCA ) 模型或条件异方差 AR.MA ( CHARMA ) 模 
型的前两阶矩相似. 

例 4 .1 考虑 CHSF 等权重指数从1926年1月至1997年12月的月简单收益率， 
共864个观察值.记此序列为仏 . 柘的样本偏自相关函数 ( PACF ) 在间隔为1和 
3处是显著的，而尺？的样本 PACF 显示条件异方差可能依赖于过去的三个新息. 
因此.我们对此序列采用特殊的双线性 模型： 


Rl= -f- 03i?t_3 十 （1 + f3idt-i + /^2«e_2 + 你叫 ~3)at. 

假定 at 的条件分布为正态分布.我们用条件最大似然法得到所拟合的模型 

Rt = 0. 014+ 0. 1607?(_ 1 —0. 104/2(_3 +(1+0.337 ttt_j —0.022 at _2~0.601 « t _ 3 ) at , (4.6) 

其中# = 0.005 2. 各参数估计的标准差依次分别为 0.003, 0.026, 0.018, 0.083, 0.084 
和 0.079. 只有叫 _ 2 的系数的估计值是不显著的.定义此模型的残差序列为 



Rt - 0.014 - 0.160 fl t -i + 

1 +0.337 o t _i - 0.022 a t _ 2 - 0.601 a £ . 3 
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其中.对，彡3，心= 0.心的样本 ACF 显示没有显著的序列相关性 ，但心 不是独 
立的序列，因为平方序列句有显著的序列相关性.模型 （4.6) 的有效性需要进一步 
研究.为了作比较.我们再对此月简单收益率序列考虑一个 ARCH(3) 模型.得到 


Rt = ().013 +0.222/?,- , -0.140 尽 _ 3 十 

of = 0.002 + O.lfiSa? , .(- 0.000 01«^_ 2 + 0.274a?_ 3 , 


(4.7) 


其中除的系数外，其他所有估计值都是高度显著的.标准化的残差序列和它 
的平方序列都没有显著的序列相关性.这表示所建的 ARCH(3) 模型对数据是充分 
的.模型 （4.6) 和 (4.7) 有_相似， 但后 者似乎能更好地拟合数据. 

4.1.2 门限自回归模型 


此模型出现的动因是实际中经常观察到的几种非线性特征，例如一个过程在上 
升和下降阶段的非对称性.它用分段线性模型来得到条件均值更好的逼近.然而. 
与传统的分段线性模型不同 的是： 传统的模型允许模型的变化发生在时间空间上， 
而 TAR 模型则利用门限空间来改进线性逼近.我们从简单的两体制 AR(1) 模型幵 


始 


{ — 1.5j ： t_x +〜，若 Xt—i < 0, 
0.5a ： t-i + a*, 若 x t -i ^ 0, 


(4-8) 


其中 a, 独立同分布服从于 N ( 0 , 1 ). 这里，门限变量为 x t _,, 延迟是〗，门限是0.图 
4-1 所示的是^的 2U0 个模拟观察值的时间图.图中加入的一条恒为0的水甲线. 
这反映出 TAR 模型的几个特征.第一，尽管在第一个体制中的系数是 一 1.5, 过程 
还姑几何遍历 (gt*ometricHlly ergodic) 和平 稳的. 事实上，模型 (4.8) 是几何遍历的 
充要条件是< 1,4 2 U 1且< 1,其中是体制/的 AR 系数，可参 
见 Pet.mccdli 和 Wool ford (1984), Chen 和 Tsay (1991). 遍历性在时间序列分析中 

是一个重要的概念.例如，证明样本均值 i = f： x t / T 收敛于 Q 的均值的统计理 

论称为遍历定理 （ergodic theorem). 它被认为是与独立同分布情形的中心极限定理 
同等重要的理论第一，该序列显示出非对称的上升和下降 态势： 若: r t _, 是负的， 
则 A 将转向一个正值，因为这时有负的膨胀系数 -1.5; 然而，若是正的，则 
经过几个时间指标后序列变为负值.从而，: r, 的时间图显示出体制2比体制1有更 
多的观察值，并丘当序列取负值时它包含有很大的向上跳跃.因此，此序列不是时 
间可逆的 (time-rcveraible). 第三，此模型没有常数项.但 E(o*,) 不为 0. 图中所示的 
这个具体实现的样本均值是().61，标准差为 0.07. —般地. E ( x t ) 是两个体制下的条 
件均值的加权平均.通常不是0,而每个体制的权重就是在平稳分布下^处于该体 
制的概率.要使 TAR 模型的均值为0,滞要在有的体制中有非零常数项.这一点与 
平稳线性模型有很大不同.在平稳线性模型中非零常数项的存在意味着 J：, 的均值 
不为零. 
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6 nil I i'h i I r,i I ..Vi" 

时间指数 

SI 4-1 模拟的两个体制 TAR ( l ) 序列的时间图 

称一个时间序列心服从门限为: r t _ d 的&个体制的自激发 ( self - excifmg)TAR 
( SETAR ) 模型，如果它满足 

x t = <Aq J 1 -t- 4>\ j) x t -i - (p^xt-p + ap 》， 当 7j-i ^ A-d < 时， (4.9) 

其中 A ， 和 c / 是正整数 ， j = 1, • • • , fc . 7 j 是满足一 oo = 7 u < 7 i < < lk-i < Ik = 
oo 的实数，上角标 （ j ) 用来表示体制， { nf } 是均值为0、方差为4的独立同分布序 
列，且对不同的是相互独立的.参数 rf 称为延迟参数 . 称为门限.这里，对不同 
的体制， AR 模型是不同的，否则可减少体制的个数. (4.9) 式的自激发 TAR 模型是 
在门限空间中的分段线忡 AR 模型.它与回归分析中诵常的分段线忡模型的思想 
相似，只是那里模型的变化是以取得观察值的时间为顺序的.只要* • > I， SRTAR 
模型就是非线性的. 

—般的 SETAR 的性质难以得到，一些特殊情形的性质可以在 Tong (1990), 
Chan (1993), Clion 和 Tsay (1998) 以及这几个文献的参考文献中看到.近年来, 
人们对 TAR 模型和它们的应用越来越感兴趣，具体可参见 Ihtnsen (1997), Tsay 
(1998) 和 Montgomery 等 （1998). Tsay (1989) 提出了一个对一兀 SETAR 检验和 
建模的方法. (4.9) 式的 SETAR 模型可以推广，只需要利用关于可测的门限 
变量(也即，它是 F f _! 屮元素的函数).这里土要要求力是平稳的，有在实直线 
的紧子集上连续的分布函数.并且在 < 时刻是已知的.这样的推广模型称为 
开环 ( open - loop)TAR 模型. 

例 4.2 为/说明 TAR 模型的应用，考虑美国从1948年〗月到 20()4 年3月的 
月平民失业率,共有675个观测.数据已经经过季节调整并且以百分比的形式给出. 
数据来自劳工部劳动统计局，图4^2给出了数据的时间图.该图显示出数据的两个 
主要特征.第一，总的来看失业率有一个缓慢上升的趋势；第二，失业率波动较大， 
倾向于迅速上升，然后迅速下降.因此，该序列不是时间逆转的，也不是单位根平 
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年 

图 ‘1-2 从1948年1月到2004年3月的美围月失业率的 N 间图，数据已经经过季彳1调格 

由于样本自相关函数衰减缓慢，所以在分析中我们使用月失业率序列的一 
阶差分序列 y t =(l- B)ut. 我们得到如下的一元 ARIMA 模型 

(1 - LLSB + 0.33 B 2 )(1 - U .51 i / l 2 ) y t = (1 1.175 + 0.48 S 2 )(1 - 0.82/? i 2 ) a t ，(4.10) 

其中 a a = 0.190, 所有的系数在5%的水平下都是显著的，其中 AR (2) 系数的比 
最小为 -2.01. 模型 (4.10) 的残差给出 Q (12) =9.9, 0(24) = 22.4, 这表明所拟合模 
型对数据序列相关性的描述是充分的.注意到尽管数据已经经过手节调整，然而季 
节 AR 和 MA 系数都是高度显 著的， 标准误差分别为 0.05 和 0.045. 因此，季节调 
整的充分性值得进一步研究. 

为了给数据中的非线性性建模，我们应用 TAR 模型，并得到如下模型 

^ _ f 0.069?/ t -2+0.153 ye _3 -f 0.106. y t _4—0.181 t / f _ i 2 + ai «, 若扒 -j <0.1， 

1 0.401 y t _ 2 + 0.208 yt _3 — 0.139?；/- i 2 + o > 2 t , 若识 _i > 0.1， （屯11) 

其中的标准误差分别为0 I 83 和 0.223, 休制1中 AR 系数的标准误差分别为 
0 048, 0.044, 0.0 43 和 0.038, 而休制2中 AR 系数的标准误差分别为 0.057, 0.060 
和 0.079. 休制1和休制 2 中的数据点分别为4 22 和 240. 模型 (4.11) 的残差没有 
显示出任何序列相 关性. 基于所拟合的 TAR 模型，当日欠业率的交化超过0.1%的. 
数据中的动态依赖关系也变得更强 一些. 这是可以理解的，因为失业率的大的丄升 
是美国经济变弱的预示，政策制定者应该更倾向丁采取措施来帮助经济，这反过来 
又会影响失业率序列的动态 关系. 因此.模型 (4.11) 能够描述美国失业率 的日、 j 变动 
态性 • 

模型 （4.10) 的 MA 表不是 

必(丑 ） w 1 + 0.01 B + 0.15 B 2 + 0.18 B 3 -f 0.16 丑 4 + … . 



8 6 4 
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因此 j / m 项在模型 (4.11) 中没有出现也并不奇怪. 

如同第 3 孕中所提到的那样.门限模型在金融中的一个重要应用是处理波动 
率对正.负收益率的不对称响应.此模型也可用来研究指数期货和现金兑换价格中 
的套利交易，见第8章中关子多元时间序列的讨论.这里我们只把注意力放在波动 
率建模上，并介绍另外一种对 TGARCH 模型进行参数化的方法.在一些应用中, 
这种新的一般 TGARCH 模型要比第 3 章中的 GJR 模型要好. 

例 4.3 我们考虑 IBM 股票的日对数收益率，从 1962 年 7 月 3 口到 2003 年 12 
月 31 日共 1 U 446 个观察值，以百分比形式给出井己包含分红.图 4*3 所示的是此 
序列的时间图.该序列是本书所分析的较长的收益率序列之一.在后期的波动率看 
上去要大一些.由于分析中我们所用的是一般 TGARCH 模型，所以该例中我们用 
SCA 包进彳了估计. 


10 - 


1970 198U 1990 2lM)0 

年 

图备3 IBM 股票从1962年7月3日至2003年12月31日的日对数收益宰-的时间图 

如采应用第： i 章屮的 GARCH 模型，对此序列我们得到如下的 AR (2 )-GAliCH 
(1,1) 模型 

r t = 0.062 - 0.024 r t _ 2 + a tl a t = ( 7 t £ ty (4 12) 

af = 0.037 4- 0.077«2_, 4 - 0.913^_,, 

其屮 n 是对数收益率，{£」是均值为0、方差为 I 的髙斯白噪声序列.均值力差 
中参数的标准误差分别是 G .015 和0.01()，波动举方程中的标准误差分别是 0.004, 
0.003 和 0.003. 所有的系数估计都是卨度显著的.标准化残差的 Ljung - Box 统计量 
为 Q (10)=5.19(0.88), Q (20)=24.38(0.23), 其中括号里的数是 p 值.对标准化残差的 
平方， Q (10)=11.67(0.31), Q (20)= l 8.25(0.57). 模型在刻画数据的序列相关性和条件 
异方差性方面是充分的.但由模型 (4.12) 得到的无条件均值为 0.060. 要比样本均 
值 0.039 大一些，这显示该模型可能错了. 

下面应用第3章的 TGARCH 模型得到 


- 20 - 
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ft = 0.014 — 0.028 r t _2 + a t , a t = a t e t , 

W = 0.075 + 0.081P t _,aL, + 0.1577V, + ().863 <t? , ( 4 . ⑷ 

其中 Pn = 1 - N t — L . TV,—, 是叫―！取负值时的指示变量，即满足若 aM < ◦， 
则 N t ^ = 1,否则= 0. 均值方程中参数估计的标准误差分别为 0.013 和 
0.009; 波动率方程中参数估计的标准误差分别为 0.007, 0.008, 0.010 和 0.010 .除了 
均值方程中常数项的估计外，所有其他的估计都是显著的.记屯为模型 （4.13) 的 
标准化的残差.对 {a,}, 我们有 Q( 10)=2.47(0.99), Q(20)=25.90(0J 7); 对 { 奶有 
Q(10)=97.07(0.00), Q(20)=l70.3(0.00). 模型不能很好地刻画数据的条件异方差性. 

为了提高对波动率中非对称响应建模的灵活性，可用 TAR 模犁的思想来改进 
此模型.具体地，我们对该序列用一个 AR(2)-TAR GARCH(l.l) 模型，得到 


rt = 0.033 — 0.023r*t—2 + 叫 , a t = cr t e t ， 

(rf = 0.075-f0.041a^_j + 0.903«r, 2 _! + (O.OSOa^! + 


(4.14) 


其中 M-i 在 (4.13) 式中有定义.模型 (4.14) 中的所有估计在1%的水平下都是显 
著地不同于零的•令心为模型 (4.14) 的标准化的残差.对 {a t }, 我们有 Q(10) = 
0.09(0.81), Q(20) = 25.29(0.19); 对{句}有 Q(10)=13.54(0.20), Q(20)=19.56(0.49). 
因此.模型 (4.14) 能充分地刻画该例中所考虑的 II3M 股票日对数收益率的序列相 
关性和条件异方差性•模型 (4.14) 中收益率的无条件均值是().033,比模型 （4.12) 和 
(4.13) 中收益率的无条件均值更靠近样本均值 ().039. 比较所拟合的两个 TGARCH 
模型，我们看到日 IBM 股票的波动率中的非对称性要比在 GJR 模型中更为强烈. 
具体地, 的系数也依赖于的符号.注意到模型 (4.14) 可以进一步改进，我 

们可以增加限制要 求当〜 y < () 时，和的系数之和为 1. 

注释估计 AR (2) TAR GARCH ( l . l ) 模 ft ! 的 RATS 程序将在本章附录 A 中 
给出.结果可能与文中由 SCA 给出的结果略有 不同. 口 

4.1.3 平滑转移 AR(STAR ) 模型 

对 SETAR 模型的一种批评是它的条件均值方程不是连续的.门限是条 
件均值函数叫的不连 续点. 鉴于这种批评，人们提出了平滑的 TAR 模型，可参见 
Clmn 和 To.ig (1986), Torasvirta ( 1994) 以及这两篇论文的参考文献.称时间序列 
{：/•,} 服从两个体制的 STAR(p) 模型，如果 {x,} 满足 

x t = c u -\r «Au,*a ： t-* + F ~ 十 S + 0 (, (4.15) 

其屮 r/ 是延迟参数，△和 .s 是模型转移的平移参数和尺度参数 ,F(.) 是一个平滑的 
转移 函数. 在实际中， F(.) 经常假定为三种形式之一： Logistic 函数、指数函数或一 
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个累积分布函数.由 （4.15) 式. STAR 模型的条件均值为如下两个方稈的加权线忡 
组合： 

p 

A*u = co + y^(po,jX t -i, 

i=l 

V 

^2t = (co + H- (<h、i 十 Ot-i. 

*=1 

权重由 F 以一个连续的方式决定.上述两个方程也决定了 STAR 模 

型的性质.例如 STAR 模型平稳性的必要条件是这两个 AR 多项式的零点都在单 
位圆外. STAR 的优点是条件均值函数是可微的，但经验表明其中的参数△和 S 是 
难以估计的.特别地，大多数实证研究表明△和 . s 估计的标准差相当大,比大致 
为1，见 Terasvirta (1994). 这种不确定性会导致在解释所估计出的模型时复杂性较 
大. 

例 4.4 我们用 3 M (Minnesota Mining and Manufacturing ) 公司股票从 1946年2 
月到1997年12月的月简单收益率来解释 STAR 模型的应用.若考虑一个 ARCH 
模型，我们得到如下的 ARCH (2) 模型： 


R t =0.014 +a f =a t £ ： t, <rf = 0.UU3 + O.lOSa^ + 0.151af_ 2 , (4.16) 

其中各估计值的标准差分别为 0.002, 0.000 3, 0.045 和 0.058. 如同前面讨论的，这 
样的 ARCH 模型不能描述股票波动率对正、负•‘扰动”的不对称反应.用 STAR 模 
型可以克服这一闲难.把 STAR 模型应用干 3 M 股票的月收益率，我们得到 


Rt — 0.017 + a t , at = cr t e t , 

af = (0.002 + 0.256a?_ 1 + 0.141a?_ 2 ) + 


0.002-0.314a^_! 

1 +exp(-l fl00ae_i) 


(4.17) 


其中均值方程中常数项的标准差为 0.002, 而波动率方程中的各估计值的标准差分 
别为 0.000 3, 0.092, 0.056, 0.001 和 0.102. 为了简化估计，转移函数的尺度参数 
100() 是事先给定的.这个模型为对正负“扰动”反应的不对称件提供了支持.对绝 
对值很大的负 a t - u 波动率模型近似为 ARCH (2) 模型： 


of = 0.002 + 0.256a?_ 1 -f 0.141a?_ 2 . 

对很大的正波动率过程近似如下 ARCH (2) 模型： 

of = 0.005 - 0.058a?.! + 0.141o?_ 2 . 

此模型中的系数为负，这与直观相违，但绝对值很小.事实上，对较大的正扰 
动 ARCII 效应较弱，即使参数估计仍然是统计显著的.计算时所用的 RATS 
程序将在附录 A 中给出. 
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4.1.4 马尔可夫转换模型 

在非线性时间序列分析中使用概率转移的思想在 Tung (1983) 中有讨论.利用 
类似的想法，但强调-个经济量在各个状态之间的非周期转移. Hamilton (1989) 考 
虑了马尔可夫转换自回归 ( MSA ) 模型.这里转移由一个隐含的两个状态马尔可夫 
链驱动.称时间序列 M 服从 MSA 模型，如果^满足 

P 

Q + « it , 如果 

i=l 

C 2 + Yl < h . iX t - i -\- a 2 t , 如果 

t=l 

其中〜是在 {1,2} 中取值的马尔可夫链，转移概率为 

尸 (s t = 2|s { _i = 1) = wx, P{st = l|«t-i = 2) = u> 2 . 

新息序列 { a u }. { a 2< } 部是均值为零、方差有限的独立同分布随机变量序列，并且 
两序列之间是相互独立的.较小的咕意味着模型在状态 i 上停留更长的时间.事 
实上 .1/ u ，， 是过程停留在状态/上的期望持续时间长度.由定义可见， MSA 模型是 
利用一个隐含的马尔可夫链来掌握从一个条件均值函数到另一个条件均值函数的 
转移.这与 SETAR 模型不同.在 SETAR 模型中转移由一个具体的延迟变量来决 
定.总之. SETAR 模型以一个确定的方案来掌握模型的转移，而 MSA 以一个随机 
体制来掌握模型的转移.在实际中，由于状态的随机性.在 MSA 模型中不能确定 
A 属于哪一个状态.当样本容量很大时.可利用一些滤波方法来对的状态作出 
推断.然而对 SETAR 模型，只要 x , d 被观察到了， . r , 的体制就已知了.这个差别 
在预测时有重要的实际涵义.例如. MSA 模型的预测总是由各个状态下的子模型产 
生的预测的线性组合，但对 SETAR . 模型.一旦被观察到了.其预测就是单个 
体制下的预测.而如果预测步长超过延迟4 SETAR 的预测也是各个体制下预测的 
线性组合. MSA 模型的估计要比其他模型困难得多，因为状态不是可直接观察的. 
Hajuillmi (1990) 采用 EM 算法来估 MSA 模型 • EM 算法是一种在取期望和取最 
大值之间重复迭代的统 i | 方法. McCuUoch 和 Tsay (1994) 考虑用马尔可大链蒙特 
卡罗 ( MCMC ) 方法佔计一般的 MSA 模型. 我们在第12章将讨论 MCMC 方法. 

McCulloch 和 i'say (19 【 J 3) 把 (4.18) 式的 MSA 模型进行/推广，允许转移概 
率 A 和 u ； 2 为 Logistic 的或者是概率值的，并且在 M 时刻可获得一些解释变童 
的凼数 • Chen , McCulloch 和 Tsay (1997) 用马尔可夫转换的思想作为工具来对非 
眹套的非线性时间序列模型进行比较和选取（例如.比较双线性模型和 SETAR 模 
型). 每一个候选模型用一个状态来表示.这种选择模型的方法是贝叶斯分布中常 
用的机会比 (odds ratio ) 方法的推广.另外. MSA 模型可以容易地推广到多个状态 
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lOfiU I 960 1970 insn 1090 

年 

m 4-4 美国实际 GNP 季度增长率的时间图，时间段为 1947. II —1991. I . 数据经过季节 
性调节.并以百分比形式给出 

表 4~1 对美国实际 GNP 的季度谁长率（经季节调节）运用 p = 4时的 MSA 模型的估计 
结果 B 


(多于两个状态）的情形.但计算暈将迅速增加.对计暈经济学中关于马尔可夫转换 
模型更多的讨论，请参见 Hamilton (1994) 的第！22章. 

例 4.5 考虑美国的实际国民总产值 ( GNP ) 的季度增长率，时间段是1947年第 
二季度到 1991 年的第一季度，以百分比形式给出.图 4~4 是经过季节调节的数据的 
时间图.其中有一条水平的零增长线.可见大多数增长率是正的.这个序列在经济 
时间序列的非线性分析中被广泛应用. Tiao 和 Taay (1994) 以及 Potter (1995) 用 
TAR 模型 ， Hamilton (1989) 以及 McCulloch 和 Tsay (1994) 用马尔可夫转换模型 
都研究过此序列. 

采用当 p = 4时 （4.18) 式的 MSA 模型，用 MCMC 方法（第12章中将 t 寸论)， 
McCulloch 和 Tsay (1994) 得到的估计列在表 4~1 中. 



参数 


4 >i 

< i >2 


必4 



估计 

0.909 

0.265 

状态1 
0.029 

0.126 

-0.110 

0.816 

0.118 

标准差 

0.202 

0.113 

0.126 

0.103 

0.109 

0.125 

0.053 

估计 

0.420 

0.216 

状态 ’2 

0.628 

-0.073 

-0.097 

1.017 

0.280 

标准楚 

0.314 

0.347 

0.377 

0.364 

0.404 

0.293 

0.064 


a 估计值和它们的标准差是 5 ()00 次迭代的 Gibbs 抽样的后验均值和标准差. 


结果中有几点有趣的发现.第一，状态1下边缘模型的平均增长率为0.909/(1_ 
0.265-0.029 + 0.126 + 0.11) = 0.965,状态2下边缘模型的平均增长率为 - 0.42/(1 — 
0.216 — 0.628 + 0.073 + 0.097) = -1.288. 这样.状态1对应有正增长率的季度或 
膨胀期.状态2对应有负增长率的季度或紧缩期.第二，状态2下参数估计的相对 


■ 

2 
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较大的标准差反应出在这个状态的观察值较少，这一点可从图 4-4 中看出，较少的 
季度具有负增长率.第三，对不同的状态,转移概率会不同，走出紧缩期的概率较大 
(1).286 对 0.118). 第四，把 1,/ w , 当作停留在状态 i 的平均持续时间长度，我们看到 
紧缩期和膨胀期的平均长度分别大约是 3. G 9 和11.3〗季度.这样.平均起来，美国 
经济的紧缩大致持续1年.而膨胀大致持续3年.最后，两个状态下：^_ 2 的 AR 系 
数的估计值差别很大，显示出美国经济的动态规律在紧缩期和膨胀期是不同的. 


4.1.5 非参数方法 

在一些金融应用中，我们可能没有足够的信息来确定两个变量 K 和 X 之间的 
非线性结构.我们希望可以在其他应用中利用计算设备和计算方法上的进展來探 
索 F 与 X 之间的函数 关系. 这就要用到非参数的方法和技巧.然而，非参数方法 
的运用不是没有代价的.它们高度地依赖子数据并容易导致过度拟合 ( oveifilling ). 
本节的目的是要介绍金融应用中的一些非参数方法和利用非参数方法的些非线 
性 模型. 所 i •寸论的非参数方法包枯核回归 (Kernel regression )、 局部最小二乘佔计 
和祌经网络. 

非参数方法的本质是“平滑 ’ ( smoothing ). 考虑两个金融变量 y 和 X . 满足 

= 十 a t ， (4.19) 

其中 m () 是任意光滑但未知的函数， {〜} 是白噪声序列.我们想由数据估计非线 
性函数 m ㈠ . 为了简单起见，考虑 X — X 这个特定的时候 m ㈠ 的估计问题.也就 
是 m ( x ) 的估汁问题.假定对应 X = z ， 我们有重复独立的观察 yu ... , y T . 则数据 
变为 

Vt = m ( x ) + a t , t = l ,-- , T . 

对数据取 T 均得到 

由大数定律，当 r 趋于 oo 时，“扰动”的平均趋于0,故沒=£ 是 m ( x ) 的一 

个相合估计.&提供了 ，〃( x ) 的个相合估汁，或者说扰动^¥均趋于零这个事实 
显示出了 T 滑的作用. 

在金融时间序列中，在 X = ； r 点我们不能有重复的观察.所观察到的是 
{( yt - Jr /.)} i * = L •， T . 但如果函数 m (-) 是允分光滑的，对应于 X t fts X 的那些 
Vt 的值仍然可以提供 m (: r ) 的较为精确的近似.向对应于远离： r 的；0的那些 V ； 
的值就不能提供对 m ( x ) 的较好近似.作为折中，估计 m ( x ) 时人们用的加权平 
均来代替简单的平均.权重应 满足： 对应于 . r 附近的的那些 V ；所给权重较大， 
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而对应于远离: r 的 X ,的 V ,所给权重 较小. 数学表 达上. 对给定; r ， m ( x ) 的估计为 


771 ( t ) 



h { x ) y t . 


(4.20) 


其中权甫 w t ( x ) 满足 ： 对应子 rr 附近的 . r t 的价所给 a ， t ( x ) 较大，对应于远离的 
心的价 所给的较小.在（ 4 _ 2() )中，我们假定所有权重之和为: T . 也可以把 
1/ T 看作权重的一部分，而权重之和为 1. 

由（ 4 .；20)式， 7 fi .( x ) 只是一个局部加权平均 (local weighted average ), 其中权重 
由两个因素 决定. 第一个因素是距离 （ x t 与 a : 之间的距 离)； 第二个因素是对给定 
的距离权重的分配.不同的距离度量方法和不同的权重分配将产生不同的非参数 
方法.下面讨论通常使用的核回归和局部线性回归方法. 

核回归 


核回归也许是最常用的平滑非参数回归方法.这时的权軍由一个核函数决定. 
典型的核函数是概率密度函数，一般记为 /((X), 满足 


K(x) >0, J K(z)dz = 1. 

为/■增强在距离度量上的灵 活性. 人们往往用一个变量/,> 0来对核凼数重新尺度 
化 

K h{x) = -K(x/h), j K h {z)dz = 1, (4.21) 

这里的 // 称为窗宽 （ handwirkh ) 权函数定义为 


uJt { x ) 


K h {x - x t ) 


(4.22) 


T 


m ( x ) ^ } 


m 


(4.23) 


K h {x-x t ) 

其中分母是一个标准化常数，它使得平滑能适应于变量 X 的局部强度而且权重之 
和为1.把 (4.22) 式代入平滑公式 (4.20) 我们得到著名的 Nadaraya - Watsoi ! 核 
估计 •• 

K fl (x-x t )y t 
Yil-i Kh{x-x t ) 

具体可参见 Narkmya ( ll ) 64 ) 和 Watson (1964). 在实际中，有很多核函数可供选择. 
然而，从瑚论和实际应用的两个角度考虑，只有几种核函数是常用的.其中包括髙 
斯核函数 

A ’ h(X) = ‘ eXP (-恙)， 

和 Epancchuikov 核 ( Epanechnikov ( 1969)) 


^ h ( x ) = 


0.75 / 





148 第 4 章非线性模型及其应用 


其中 1( A ) 是一个示性函 数：若 M 成立则 / M ) = 1,否则 /( ⑷= 0.图以所示的 
是当/〖=1时高斯核和 Epaneclinikov 核的图像. 



图 4-5 标准高斯核（实线）和 Epanechnikov 核（虚线)，窗宽均为 h = 1 


为 f 理解窗宽所起的作用，我们米评价一些带 Epancchnikov 核的 Nadaraya - 
Watson 估计在观察值{: c t } 上的表现.考虑两个极端 情形： 第一，若 /t — 0,则 


m(xt) 


I<hWyt 


K h (0) 

这表明很小的 / i 佥重现数据 本身； 第二，若 " - 


= yt .， 
+ 00 ,则 


m { xt ) 


ELi f<h{0)Vt 



Vt - Vi 


说明很大的 /» 会导致过度平滑曲线 样本均值.一般地，窗宽 //. 的作用 如下: 

当 h 很小时，权重只集中在每个 X t 邻域内的少数观察 值上； 当/1很大时，权重会 
分散到 A 的较大邻域内.总之，/ I 的选择在核回归分析中起着重要作用.这就是核 
回归屮有名的窗宽选择问题. 

窗宽的选择 * 

窗宽的选择有几种方法，可参见 Hardle (1990) 以及 Fan 和 Yao (2003). 第一 
种方法是塞入法 （ plug-in method ). 该方法基于比较平滑的核函数的积和均方误差 
( MISE ) 的渐近展开.考虎 

MISE = E [ [ ih ( x ) — m ( a :)] 2 di . 


其中 m (-) 是真实函数. MISE 中的量 E [ m ( x )- m ( a :)] 2 是对在 z 点的估计值也⑷的 
均方误差 ( MSE ) 的一个点的度量.在某些正则性条件下，我们可通过最小化 MISE 
得到最优窗宽.最优窗宽一般依赖于待估的未知量.这些未知量必须由数据用某种 
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初步平滑去估计.要得到合理的最优窗宽估计，需要多步叠代.在实际应用中，初步 
平滑的选择是一个问题 • Fan 和 Yao (2003) 给山了个正态参考窗宽选择 

t / l . oe ^ r - 1 / 5 , 高斯核， 

P \ 2.34 sT* _1 / 5 ，Epanechnikov 核， 

其中 s 是 平稳独 立随机变量的样本标准差. 

窗宽选择的第二种方法是漏掉一个观测的交叉验证 ( cross - validation ). 第一步, 
去除一个观测 ( xj , yj ). 用剩下的:/ •- 1个数据点得到如下的在巧点的 平滑： 

它是吣的-•个估 il 值.其中权重 uj t { xj ) 的和为 T - 1. 第二步，对 j = 1 ,... ，了都 
做第一少，并且定义函数 

1 T 

CV W =于 [ \ y ]-^ 3 { xj )\ 2 W { xj ), 

J =1 

其中 W (.) 是一个非负的权重函数•满足 f ； W { xj ) = T . 如果必要，它可用来降低 

边界点上的权重.因为对于接近边界的点，通常只有很少数的数据点与之相邻.所 
以有降低它们权重的必要.函数 CV ( h ) 称为交叉验证 函数. 这是因为它验证了平滑 
函数预测 { yt }^ 的 能力. 我们可以通过最小化 CT (.) 来选择窗宽 • 

局部线性回归法 • 

假定 (4.19) 式中 m (.) 的二阶导数存在，并且在点； r 处连续,这里 z 是 m (.) 支 
撑中的—个给定的点记能获得的数据为^非参数回归中的局部线性 
回归法就是要找出 a 和 fc ， 使下式达最小值： 

T 

£(u ， b) = Y^[yt ~ a - 6(z - x t )] 2 /C^(ar-a: t ), (4.24) 

1=1 

其中坑 (•） 是 (4.21) 式中的核函数!是窗宽_记 a 的估计值为 a , 则 m ( x ) 的估计 
定义为在实际屮，假定 . T 是独立随机变量的观 测值. 估计值&可以作为对 m (.) 
的一阶导数在: r 点取值的估计. 

在最小一乘的埋论卜， (4.24) 式是一个加权最小二乘问题，并且我们可以推导 
出 a 的显式解.具体地.求 L ( a , b ) 关于 a 和6的偏导数，然后令偏导数等于（)，我 
们得到有两个未知数的两个 方程： 

^ T T 

JZ Kh ^ x - ~ x t) + b^2(x- Xt)K h {x-x t ), 

♦=1 t=l t=l 
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T T T 

-x t )Kh{x - x t ) =0 (x - xt)Kn(x - x t ) + 6^2 (x - x t ) 2 Kh{x - x t ). 

e=i t=i t=i 

定义 T 

ST,1 = K lt {x-x t )(x - x t )' j = 0,1,2. 

«=i 

上述两个方程变为 


STM s T,l 


a 

ST,l ST.2 


b 


T 

^ f<h{x - x t )y t 



T 

y^Qr- x t )K h {x - x t )y t 


从而.我们有 


a 


•Sr ,2 E 二 1 - X t )tJt - S T ,\ Et=l ( J - X t )K h (x- X t )yt 


ST,0«r,2 - H T,l 


卜式 的分子和分母可进一步简化 


T 


«r, 2 ^ ,^h{x — x t )yt — st,\ (x - x t )Kh(x - x t )yt 

t=i t=i 

T 

= y^[Kh(x - xt)(sT,2 - (x —it) s r,i)]l/t, 

t=i 

T T 

!ir,0»T,2 - *r.l = 51 h •以 X — x t) s T,2 - ( 工 - x t )/0“x - X't)«r,l 

d**X 1=1 

T 

= y^ K ll (x - X t )[sT,2 - (x -X/).9T,l]- 


综合之，我们有 


其中定义为 


a 




^tVi 


eLi 




uJt = Kh(x - x t )[sr,2 —( 工一 -TtJsT.i]- 


在实际应用中，为了避免分母为 0 的情况，我们使用 m ( x ) 的如下 估计: 

m(ar) = v-T , X - 
1 . 1=1 叫 + 界 

注意到 (4.26) 式有一+很好的 特性. 就是 权重⑼ 满足 


T 


- x t ) u>t 


0. 


(4-25) 


(4-26) 
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另外.如果只假定 (4.19) 式中 m (.) 有一阶导数，通过求 

T 

- a )' 2 K h {x - x t ) 

t=i 

的最小值点，可得到前面介绍过的 Nadaraya Watson 估计.一般地，如果假定 m ( x ) 
有有界的阶导数，则可用一个 （ A ， 1) 次多项式代替 (4.24) 式中的线性多项式. 
我们把 (4.26) 式中的估计称为局部线性回归平滑. Fan (1993) 证明了在某些正则条 
件下局部线性回归有某些重要的抽样 性质. 窗宽的选择可以用与前面吋论过的相 
同的方法得到. 


时间序列的应用 

在时间序列分析中，解释变量通常是序列的延迟值.考虑单个解释变量的简单 
情形.这时模型 (4.19) 变成 

x t - m ( xt -^) 4- a t . 


可以直接应用前面所 i ■寸论过的核回归和局部线性回归方法.当有多个解释变置存 
在时，需要作一些修改后再用非参数力法.对核回归，我们可以用多兀核函数，如具 
有给定协力差矩阵的多元正态密度函数 

仙)- (去 /s 、) ， 

其中 P 是解释变量的个数: S 是事先给定的正定矩阵.也可以用一元核函数的乘积 
作为多元核函数.例如 


Kh{x) = ] 


0.75 

hi 


O-SHIll 



这一方法比较简单，但忽略了解释变量之间的关系. 

例 4 .6 为了说明非参数方法在金融中的应用.考虑二级市场丄从1970年到1997 
年 3 个月期国库券的周利室，共1 46() 个 观测. 数据是从圣 • 路易斯联邦储备银行 
(Federal R(；serve Bank of St Louis ) 得到的，图 4 _6 给出了数据的时间图.这些序列 
在文献中经常用到.作为用直接观测数据估计随机扩散方程的例子，读者可参见第 
6章的参考文献.这里我们考虚一个简单模型： 


yt = /J.(xt-i)dt + cr(x t ^ 1 )dw t , 

其中 A 是3个月期国库券利率 ，价 =心叫是标准布朗运动， M (.) 和 a (.) 
是的光滑函数.应用 S-Plus 中局部光滑函数 lowess 可得到 "(.） 和 tr (.) 的非 
参数估计,详细可参见 Cleveland (1979). 为简笋起见，我们用作为 A 波动率的 
代表. 
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1970 1*)75 1980 1085 109 () 1005 

年 

m 4-6 二级市场上从1970年到1997年3个月期国库券的周利率的时间图 

对于上述所考虑的简单模型. /^ Vl ) 是给定时奶的条件均值.即 
=.图 4-7 a 给出了 y ⑴对: r t _^ 的散点图.该图还包含由 S-Plus 中的 
lowess 所得到的 / x ( x t -!) 的局部平滑估计.估计本质上是 0. 然而，为/更好地理 
解该估计.图 4~7 b 给出了更精细刻度下的估计值我们发现一个很有趣的 
现 象：当 的值很小时，是 正的; 而当:的值很大时， fiixt .-,) 变成了负 


⑷ (c) 



s g ® S 2 2 S g g § £ 22 2 S 

c o c? c d d d o c: o 3 cf s d 


4<- i ) 4 t - i ) 

图 4*7 通过局部平滑方法所给出的 3 个月期国库券的周利率的条件均值和波动率的 估计： 
( a ) 对 xt - i , 其中 yt = x t — Xt-ii 是利率； （ b ) / x ( xt - i ) 的估计； （ c ) | yt | 对 

( d ) < r ( x t _ i ) 的估计 















4.1 非线性模型 153 


的. 这与常识相 一致： 即当利率很高时，期望其 下降； 而当利宇很低时又期望其上 
升图 4~7 c 给出了 ⑴ | 对的散 点图. 估计 由 lowcss 给出. 该 图进一 
步证实了，利宇越高，波动率越大•阁 17 d 给出了更精细刻度下的估计值 a ( x t _0. 
可以很淸楚地看到波动率是的增函数，当达到10%时斜率在增加.这 
个例子说明了简单的非参数方法在理解金融时间序列的动态结构时很有用. 

例 4.6 中所用到的 S - plus 命令 

> zl=matrix(scan(file= , w-3mtbs7097.txt J ),4) 

> x=zl[4,1:1460]/100 

> y=(zl 『 4,2:1461]-zl[4,1 ： 1460] )/100 

> par(mfcol=c(2,2)) 

> plot(x,y,pch- ， **,xlab=*x(t-l)*,ylab=*y(t)*) 

> lines(lowess(x,y)) 

> title(main- # (a) y(t) vs x(t-1)•) 

> fit=lowess(x r y) 

> plot (fit$x,fit$y,xlab= , x(t-l) f .ylab^mu* , type=*l', 

+ ylim= c(-.002,. 002 )) 

> title(main=* (b) Estimate of mu{.)*) 

> Plot(x,abs(y),pch= * *',xlab=*x(t-1)*,ylab=*abs(y )•) 

> lines(lowess(x,abs(y))) 

> title(main=* (c) abs(y) vs x(t-1)•) 

> fit2=low«ss(x,abs(y)) 

> plot(fit2$x < fit2$y,type=*l\xlab=*x(t-l) * ,ylab=* sigma* , 

+ ylim= c(0,.01)) 

> title(main*' (d) Estimate of sigma (•”） 

下面介绍几个由非参数方法导出的非线性时间序列模型. 

4.1.6 函数系数 AH 模型 

非参数方法的新近成果使得研究人员在提出非线性模型时可以放松参数型的 
约束.有些情形下，非参数方法用来对数据进行初步研究,以帮助选择一个参数型非 
线性模型. Chen 和 Tsay (1993 a ) 采用这种 方法. 提出函数系数自回归 ( fnnr . t . ional - 
coefficient autoregressive , FAR ) 模劫 

x t — + … + fp ( X t - i ) xt- p + at , (4.27) 

其中 X t -i = ( xe-ii ••- iXt - k )' 是由的延迟值所构成的 向量. 如果有必要， X t -i 
可以包含在1时刻已知的其他解释 变量. (4.27) 式中的，(•）往往假定是几乎处 
处连续、甚至是二次可微的 • 前面讨论过的绝大部分非线性模型都是 FAR 模型的 
特殊 情形. 在实际应用中，我们可用非参数方法（如核回归或局部线性回归）来估 
计函数型系数/,(.)，特别是当的维数较低的时候可以这样做（尤其是当 
是一维的时候).最近， Cai ， Fail 和 Yao (2000) 用局部线性回归方法去估计 /,(•), 证 
明了用 FAB 模型可以在向前〗步预测上获得很大改进. 
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4.1.7 非线性可加 AR 模型 

把非参数力法应用到非线性时间序列分析中的一个主要困难是“维数灾难” 
(curse of dimensionality ). 考虑一个一般的 AR ( jp ) 过程 • • • yX t - p ) + a t . 

直接用非参数方法来估计 /(•) 将需要 P 维的平滑.当 p 很大时这难以做到，尤其是 
在数据点的个数不是很多时.克服这-凼难的一个简单而有效的方法是考虑叫加 
模型.这样的模型只需要低维的 平滑. 称时间序列 A 服从非线性可加 AR (简记为 
NAAR ) 模型，若 

V 

x t = fo ( t ) + ^2 M x t - i ) + (4.28) 

i=l 

其中 /,(.) 是几乎处处连续的函数.因为每个 /,(.) 只有一个自变量.可以用一-维平 
滑方法，从而避免维数灾难.在应用中，在给定 fA-),j ^ i 的条件下.估计 /,(.) .这 
种迭代方法可用来估计 NAAR 模型更多细节和 NAAR 模型的例子，可参见 Chen 
和 Tsay (1993 b ). 

可加性的假设限制性相当强，所以在应用中要仔细检验. Chen ， Liu 和 Tsay 
(1995) 考虑了检验可加性的检验统计量. 

4.1.8 非线性状态空间模型 

利用 MCMC 方法的最新进展 （Gelfand 和 Smith (1990))， Carlin , Poison 和 
Stoffer (1902) 提出了非线性状态空间建模的蒙特卡罗方法.所考虑的模型为 


St = + u t , x-t = <7 t (5 t ) + v t , (4.29) 

其中&是状态向力 ㈠ 和奶 (.） 是依赖某些未知参数的已知凼数. {〜} 是具有零 
均值.非负定的协方差矩阵的独立同分布的多元随机向量序列，是均值为 
零、方差为4的独立同分布随机变量序列.且与独立.因为对于一个非 
线性系统，需要给定的条件下&的整个条件分布，所以蒙特卡罗方法可用来 
处理状态转移方程的非线性演变 . Kitagawa (1998) 及其参考文献中考虑了其他的 
对非线性时间序列分析的数值平滑方法. MCMC 方法（或者一些高强度计算的数 
值方法）是非线性时间序列分析的有力工具,但这些方法的潜力还没有充分发掘出 
来.然而， (4.29) 式模型中假定了，(.）和 g t (.) 的形式己知，这是在实际应用中运用 
卜述 方法的障碍.克服这一局限的方案是，使用诸如对 FAR 和 NAAR 模型分析时 
所用的非参数方法，在用非线性状态空间模型之前对 /,(.) 和仍 (.） 进行具体化. 


4.1.9 神经网络 

现代数据分析的一个常见问题就是神经网络.神经网络方法可归类为半参数 
方法.有关神经网络的文献非常多.它在很多学科中有应用，且应用成功的程度也 
不尽相同，具体可参见 Ripley (1993) 的第2节所列的应用以及第10节中关于其在 
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金融中应用的 评汴. Cheng 和 TittrHngtcm (1994) 提供了从统计学角度看神经网络 
的信息本节主要关注“前馈” ( feed - forward ) 神经网络.它将原始信息输入到由一 
个或几个神经元（或称为结点）构成的输入层，而这些结点向前连接到下一层.直 
到到达输出层•图4 8 举了一个简单的例子.它是带有一个隐层的、用来处理元 
时间序列分析的简单的前馈神经网络.其输入层有两个结点，隐层有三个结点•输 
入层的每个结点都向前连接到毎个隐层的结点上，而这些隐层的结点都连接到输出 
层的一个单独 结点. 我们称这个网络为个 2-3-1 的前馈神经网络.更多复杂的神 
经网络包括那些带回馈连接的网络都己经在文献中提出，但与我们学习关系最多的 
还是前馈神经 N 络. 



图 I - 8 —个用于处理一元时间序列分析的带有-个隐层的前馈神经网络 


前馈神经网络 

神经网络由一层向下一层处理加工信息是通过一个 “ 激活函数” (activation fuc - 
tion ) 来完成的.考虑带有一个隐层的前馈神经网络，隐层的第 j 个结点定义为 

h i = fj(aoj (4.30) 


其中 •/:, 是输入层第 i 个结点的值 ，人 (.） 是一个激活函数，典型的是取 logistic 函 
数： 


fj ( z ) = 


exp ⑷ 

1 4 - exp(z)' 


称为偏差， 对 i ”• 求和是指对输入层中所冇指向的结点求和，是权重. 
比如在图 IS 中的 2-3-1 前馈神经网络的隐层中的第 j 个 结点： 


hj = 

输出层的结点定义为 


exp(a；oj 十 -\-w 2 jX 2 ) 

1 十 uxp(tt 0j + WijXi 4- W 2 ]X 2 ) ' 


1,2.3. 


(4.31) 


O = /o ( «0o + w io h 3 ) 1 (4.32) 

、 j-*o / 

其中激活函数 /„(•) 是线性函数或 Heaviside 函数.如果 /„(•) 是线性函数.则 
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其中 A : 是隐层中结点数目.一个 Heaviside 函数中有这样的定义：如果 2 > 0，则 
Mz ) = 1,否则 f 0 ( z ) = 0. 把带有 Heaviside 函数的神经元称为门限神经元. “1” 代 
表神经元发出信息.例如.考虑图4~8中的 2-3-1 网络，如果激活函数是线性的，则 
其输出值是 


o — a 0u 4 - n]\ u h\ + w 2 u h 2 4 - W30/13 ； 

如果/。(.）是—个 Heaviside 函数，则输出值是 

{ 1，如果 a 。。 + w io hi + ui 2 o h .2 -f w 3 „ h .3 > 0, 
( J . 如果 a 0o + wi 0 hi + w 2 o h2 + w 3 o h 3 ^ 0. 

联合各个层来看.前馈神经网络的输出值可以写成 


fo 


«o 0 + 5 Z w jofj(<^oj + 


如果允许输入层直接连接到输出层，则该网络变成 


fo 


代 Oo + > 二 : ^jofj {^Oj + 〉 = 


(4.33) 


(4.34) 


其中第一个求和号是对输入结点求和.当输出层的激活函数是线性的，输入层到输 
出层的直接连接意味着输出值是输入值的一个线性函数.从而在这个特殊情形下, 
(4.34) 式是线性模型的一般形式.对于图 4^8 的 2-3-1 网络，如果输出激活函数是 
线性的，则 (4.33) 式变成 

3 

o = a 0o I w j 0 hj , 

i=l 

其中 \ 在 (4.31) 式中给出.从而该网络有〗 3 个参数.如果用 （3_34) 式，则网络变 
为 

2 3 

o = «0o + ^ Qi 0 a：<4 - ^ Wj„hj, 

»=i j=i 

其中 ~在 (4.31) 式中给出.网络参数的数 0 增加到 15 个. 

我们称等式 （4.33) 或 (4.34) 中的函数是半参数函数，这是因为它的函数形式 
是已知的，而结点个数以及结点的偏差和权重是未知的.等式 (4.34) 中从输入层到 
输出层的直接连接意味着该网络跳过了隐层.我们把这样的网络称为一个跳过隐 
层的前馈网络. 

前馈 M 络在 神经网 络的文献中称为多层感知器 ( percetrons ). 它们在紧集上可 
以通过增加隐层的结点数目一致逼近任何连续函数，具体可参见 Hornik . Stinch - 
combe 和 White (1989); Hornik (1993); Chen 和 Chen (1995). 神经网络的这个性质 
是多层感知器的一般逼近性质.简言之，带有一个隐蔽层的前馈神经 网络可 以看成 
是一种对一般的连续非线性函数参数化的方法. 
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训练和预測 

神经网络的应用包括两个 步骤： 第一个步骤是训练网络（例如去建立一个网 
络，包括确定结点数目以及佔计它们的偏差和权 重)； 第_：个步骤是推断，特别是预 
测. 在训练阶段数据通常被分成两部分不相重叠的子样本.第一组于样本用米估计 
已知的前馈神经网络的参数.第二组于样本用第-步建立的 N 络来进打预测和计 
算它的预测精度.通过比较顸测效果，可以选出比其他效果好的“最优”网络来进 
行推断.这正是在统计模型选择中应用非常广泛的交叉验证法的思想.也可以利用 
其他的模型选择方法. 

在一个时间序列的应用中，令 = 为网络训练可利用的数据. 

其中 a 表示输入值的向量，而是所关心的序列（比如一项资产的对数收益率). 
对于一个给定的网络•令 q 为输入值是的网络的输出值，可参见等式 （4.34) .训 
练一个神经网络相当于选择它的偏差和权重来最小化某种合适的标准，比如，最小 
二乘 

S 2 = (rt — o t ) 2 . 
t=\ 

这是一个非线性估汁问题,它可以用一些迭代方法解决.为了保证所拟合函数的光 
滑性，要对前面的最小化问题加上一些附加的约朿.在神经网络文献中，向后传播 
(Back Propagation ( BP )) 学习算法是一种网络训练的普遍方法 . BP 方法由 Bryson 
和 Ho (19 C 9) 提出.它从输出层开始逆向进行，并且反复用梯度规则来修正偏差和 
权重 . Ripley (1993) 中的附录 2 A 提供了 Back Propagation 的推导.一■日.一个前馈 
神 经网络 建立.它就能在预测子样本中用来计算预测了. 

例4- 7 为举例说明金融中神经网络的应用，我们考虑 IBM 股票从1926年1月 
到1099 ^ I 2 月的月对数收益率，以百分比形式给出并且包括分红.我们把数据分 
为两组子样本.第一组子样本由从 192 G 年1月到1997年12月的864个数据组 
成.下面用它来建立模型.用 (4.34) 的带有三个输入值和含两个结点的隐层构成的 
模型，我们可以得到一个 3-2-1 的序列网络.这三个输入值分别记为，和 
r t _3, 偏差和权重由下式给出 

ft . = 3.22 - 1.81/ i ( r ,_ i ) - 2.28/ 2 ( r t _!) -0.09 r t _i - 0.()5 r t _ 2 - 0.12 r t _ 3 , (4.35) 

其中 rt -! — r t _ 2 , r t _ 3 ), 两个 Logistic 函数是 

r ) 一 exp (—8.34 — 18.977' t-i + 2.17 rt—2 - 19.17 r * t -3) 

卜 1 + exp (-8.34 - 18.97 r ^, + 2.17 r f _ 2 - 19.17 r f _ 3 ) 1 


/2(r t -i) 


cxp(39.25 22.17r f _ x 17.34r ( _ 2 - 5.98r f _ 3 ) 

1 + exp(39.25 - 22.17r t _, - 17.34r t _ 2 - 5.98r t _ 3 ) 
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前面模型的残差标准误差是 6.56. 作为对照.我们也用同一数据建立 AR 模型，得 
到 

r t = 1.101 + 0.077 re-x cr a = 6.61. (4.36) 

这个模型的残差标准差比式 (4.35) 的前馈祌经网络的稍微大一点. 

预测比较 


1998年和1999年的 IBM 股票的月对数收益率构成了第二组子样本，用其来 
评价神经网络对样本以外的数据的预测效果.作为比较的基准模型.我们用第一组 
子样本的样本均值 r , 对第二组子样本的所有月收益率进行1步向前预测.这相 
当于假定 IBM 股票的月对数价格服从一个带漂移项的随机游动模铟.这个基准模 
型均方预测误差 ( MSFE ) 是 91.85. (4.36) 式的 AR (1) 模型.它的1步向前预测的 
MSFF . 是91 7 a 因此， AR (1) 模型比基准模型效果稍好一点.而 (4.35) 式的 3-2-1 
前馈网络的 MSE 是 91.74, 与 AR (1) 模型效果基木相同. 

注释我们用初始权重设为蚨省值的 S-Pltus 程序来完成对前馈网络的估计. 
要了解更多信息参见 Venables 和 Ripley (1999). 我们有限的经验表明估计结果是 
变化的.对例 4.7 中用到的 IBM 股票收益率， 3-2-1 网络的样本外数据的 MSFE 敢 
低可为 89.46. 最高可到 93.65. 如果我们改变隐层的结点教目，则 MSFE 的变动范 
围可以更宽.附录 B 给出了例 4.7 中用到的 S-Plus 指令. U 

例 4.8 前馈 N 络的优良特性包括其灵活性和广泛适用性.举个例于.我们用一个 
网络.它的输出层的激活函数是 Heaviside 凼数，米预测例 4.7 中考虑的 IBM 股票 
的价格变动方向.定义一个指不变量 

. = f 1,如果 r t >0， 

' I 0, 如果 r t < 0. 


我们用8个输入结点和4个隐层结点建立一个 8-4-1 前馈网络来预测第一组子样 
本的必，其中8个输入结点是由前4个^和4的延迟值组成的.这个网络用 TII - 
算在第二组子样本中的1少向前的向上运动（例如正收益）概率.图 4-9 表示的是 
—个典型的概率预测的输出值和第二组子样本的实际力向，后者在图中以 “ 0 ” 标 
出. 在图屮添加一条概率为 U .5 的水平线.如果我们采用较为严格的 方法： 当概率 
预测结果大于或等于 0.5 时，令石=1,否则令忒 = 0 . 那么神经 M 络的蚀测成功 
率为 0.58. 当从一个估计变成另一个时，这个网络的成功率会显著改变，这个网络 
有49个 参数. 为了更深入的理解.我们做一个模拟研究，将 8-4-1 网络运行500次， 
计算用以前的方法预测时向上或向下运动的出错数目.在这500次中.平均错误的 
数目和错误的中值分别是 11.28 和 11. 错误最多和最少的数目分别是18和4.作 
为对照.我们再用带漂移项的随机游动模型进行500次模拟预测，即 

j / 1,如果 = 1.19 -f ^0, 

☆ = 1 0，否则， . 
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其中 1.19 是 IBM 股票从1926年1月到1997年12月的平均月对数收益率， { e t } 是 
服从 N (0, 1) 的独立随机变量序列.预测错误的数目的平均值和中位数变为 10.53 
和11,而错误最多和最少的数目分别是17和5.图 4-10 是两种模拟方法的预测出 
错数目的柱状图.结果表明对于 IBM 股票的月对数价格， 8-4-1 前馈神经网络不比 
假定为一个带漂移项的随机游动的简单模型更好 • 



图 4-9 用 8-4-1 前馈神经 M 络对 IBM 股栗 H ： 的月收益进行1步向前概率预 测. 预测期是从 
1998年1月到1999年12月 



神妗 M 络 带漂移的随机游动 

图 4-10 对 IBM 股票的月对数收益率的变动方向进行预测时错误数目的柱状阁.预测期是从 
1908年1月到1999年12月 


4.2 非线性检验 


本节讨论一些在文献中出现过的非线性检验方法.它们对 4.: i 节中考虑 的非线 
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性模型有很好的功效.所讨论的检验包括参数和非参数统计量.平方残差的 Ljung - 
Box 统计.双谱检验 （bispectral test ) 和 BDS 检验都是非参数方法. RESET 检验 
( Ramsey , 1969), T Sa y (198( i ，19 S 9) 的 F 检验.以及其他的拉格朗日乘子法和似然比 
检验法都依赖特定的参数函数.因为非线性的情况有很多，所以检测非线性时没有 
比其他方法都更好的一种单独的检验方法. 

4.2.1 非参数检验 

在线性假设下,一个合适确立的线性模型的残差应该是独立的.任何对残差独 
立性的违背都说明了现有模型包括线性的假设不合适.这就是各种非线性检验背 
后的基本思想.特别地，设计一些非线性检验就是用来检验指定的时间序列的一次 
形式可能出现的违背情况. 

平方残差的 Q - 统计量 

Mcleod 和 Li (1983) 对 ARMA ( p , f/ ) 模型的平方残差应用 Ljung-Box 统计量来 
检査模型的不足.这个检验统计量是 

Q[m) = T(T + 2)f2jr^l ， 

t=l 

其中 r 是样本容量 . m 是一个恰当选取的在检验中自相关的数目，〜是残差序列, 
而么 ( a ?) 是的 i 阶自相关函数 ( ACF ). 如果现有的线性模型是合适的， g ( m ) 应 
该渐近服从自由度为 m - p - a 的分布.就像第3章提到的那样，前面的 Q - 统 
i 十暈用来检测〜的条件异方差性，渐近等价于 Engle 在 1982 年提出的对 ARCI1 
模 M 的拉格朗日乘子检验法统 计量. 貝体可参见 3.4.3 节.这个统计量的原假设是 
Ho - Px - ^m = 0, 其中达是下面的线性回归的的 系数： 

a i = A) + + • * • + + et, 

其中 < = m + l ,... , r . 因为这个统计量由残差计算得到（而不是直接观察到的收 
益率)，所以自由度是 m - p —q. 

双谱检验 （Bispectral Test ) 

该检验方法可以用于检验线性和正 态性. 它建立在这样一个结 果上： 线性时间 
序列合适的标准化的双谱对所有频率都是常数,而且在正态时，这个常数值就是零. 
一个时间序列的双谱是该序列的三阶矩的 Fourier 变换.对 (4.1) 式的平稳时间序 
夕 IJ 其三阶矩定义为 


r(u, v ) - g 


V 4 •妒 


(4.37) 
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其中 w 和 v 是整数，= E ( a ^), 咖=1,当 A : < 0时必 t = 0.对 (4.37) 式作 Fourier 
变换，我们得到 

6 3 ( wi , u / 2 ) = 十 w ；2) jr ( w ， i )「( w ；2)， (4.38) 


其中 r(w;) = ^2 V^exp(-him)， 而 i = u)i 是频率 .:r t 的谱密度函数由下式给 

u=0 

出： 

p(w) = ^|r(«；)| 2 , 

其中 u； 是频率.从而，函数变为 

b{w 1 ,w 2 ) = - 二 2 )!丄 --=常数，对所有 （M；i，ti，2). (4.39) 

p{Wi )p(W2)p[Wi + W 2 ) 

双谱检验利用了 (4.39) 式的性质.基本上.我们通过选取合适的格子点来估计 (4.39) 
式中的函数 b(w^w 2 ) 并且用一种类似 Hotelling 的 r 2 统计量的检验统计量来检 
验 b^w；) 的常数性.对一个线性高斯序列， E(a?) = g = 0 , 所以双谱对所有频率 
(wi，w-2) 都恒为零.对双谱检验的更详细的讨论可参见 Priestley (1988), Subba Rao 
和 Gabr (1984), Hinich (1982). 有限的经验表明当样本容量很大时，这种检验法有 
很好的功效. 

BDS 统计量 

Brock, Dechert 和 Scheinkman (1987) 提出了一个检验统计量.通常称之为 
BDS 检验.它用来检测一个时间序列的独立同分布假设.这个统计量不同于其他 
讨论过的检验统计量，因为后者主要集中在^的2阶或3阶性质上. BDS 检验法 
的基木思想是利用混沌时间序列分析中常见的“相关性求和给定一个 fc 维时间 
序列X,和观察值 {X 也 ， 定义其相关性求和为 

⑽ ) =仏 7i^hrj^ fs(Xi ' x ^ (440) 

其中 h(u，v) 是一个示性变量.当 ||u- t;|| <(5 时它等于1，否则等丁-0,其中 11.11 是 
上确界范数 (hupuorm). 相关性求和度量了相距不超过 <5的一对数据（不}占所有 
数据对的比重.考虑下一个时间序列 A .设 fc 维向量 

称为历史. BDS 检验的思想如下.把一个 A: 历史看成 A: 维空间屮的一个点.如果 
确实是独立同分而随机变量序列的话，那么&历史 {X t }]l x 应该在 A： 维空 
间中看不出样式来.从而，相关性求和应该满足关系 C k {6) = [^(^)|\如果违背了 
此式就表明：小是独立问分布的.举一个简单而又能说明问题的例子.考虑一列 
独立同分布的随机变量，服从 [0,1] 上的均匀分布.令 [a，b] 是10,1|的子区间，考虑2 
历史 （o: t ，x t+ i), 它表示2维空间中的一个点.在独立同分布假设下，在 [a,b]x[a,b] 
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中2历史数目的期望应该等于 [ a , bj 中心 数目期望的平方.这个想法可以用相关 
性求和对应的样本进行正式的检验.定义 

Ci(S, T) = ― 2 _ V ； 1 6 {X：, X；) t l = hk, 

' ’ i<j 

其中刃 = 7 1 — / + 1. 当 / = 1 时 Y ， = rr <; 当 / = A •时 X；* = 々. 在 {x t } 是独 
立同分布的并南北退化的分布函数 _ F (.) 的原假设下， Brock , Dechert , Scheinkman 
(1987) 指出，对任意固定的（和5都有 


C ^ T )-*^)^ : (以概率 1，当 r — oo ). 

更进一步，统计量 Vf { c k (^ T )~ [ Ci ^ T )^} 渐近于正态分布，其均信为零.方差 
是 

a 2 k {S) = 4 (JV k + 2j^^ k ~ j C 2j + {k- \) 2 C 2k - k 2 NC 2k ~^ , 

* » 

其屮 C = [F{z i-6)-F{z- d)]dF{z), N = [F(z + 6)-F(z-S)\ 2 dF{z). 注意到 
是 c 的相合估计，而 tv 的相合估计可以为 


N(S,T) 


T k {T k - l)(T fc - 2) 


^ : ) ^6 i^a » <^u ) • 

t<a<u 


于是 BDS 检验统计量定义为 


D k ( S y T ) = v ^ jCfc ^ T )- [ C ,(^ T )] fc } / a k (6, T )' (4.41) 

其中 a k ( S , T ) 是在 a k ( S ) 中用 CMAT ) 和 N ( S , T ) 分别代替 C 和 iV 时得到的.这 
个检 验统计 M ； 的极限分布是标准正态的.应用 BDS 检验的更多的讨论和例子请见 
Hsich (1989); Brock, Hsieh, LeBarou (1991). 实际应用中，在用 BDS 检验前如果数 
据有线性相依性，则我们要太掉其相依性.这种检验对 fc 和5的选择可能很敏感， 
尤其当 A : 比较大的时候. 

4.2.2 参数检验 

本节将0光转向参数检验，考虑 Ramsey 的 RESET 检验 (19 GU ) 以及它的推 
广.我们仍然讨论一些检验统计量米检测门限非 线性. 为简化记号，我们在讨论中 
使用向量和 矩阵. 如果需要的话读者可以浏览第8章的附录 A 简单复习一下向量 
和矩阵的相关内容. 




RESET 检验 
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Ramsey (1969) 提出一神对线性最小二乘回归分析的规范检验.称这个检验为 
RESET 检验. 它可以很容易地应用子线性 AR 模型.考虑一个线性 AR ( p ) 模型： 


xt = -f a f , (4.42) 

其中 ，: Trt—p)'， 少=(“… ，0〆. RESET 检验的第一步是获 

得 (4.42) 式中的最小二乘估计<?!)，然后计算拟合值心= XU . 残差 a t = x t - x t , 

以及残差平方和 5 S /?„= £ al 其中 r 是样本容量.第二步考虑线性 回归： 

t=p4 1 

= X*_ 1 ai -I- M<_ t Q!2 (4.43) 

其中 M t _ 1 = (赶，…对某个1，再计算最小二乘残差 

v t = at - Xj . jQ ：! - Mj_jd2, 

以及回归的残差平方和 SSRi = Y ： v 2 f RESET 检验的基本思想是如果 (4.42) 

t — p-f 1 

式的 AR.(p) 模型合适的话，那么 (4.43) 式中的和应该为零.这可以通过一 
般的 F 统计量进行检验. (4.43) 式的 F 统计最 如下： 


( SSRp - SSR^/g 

" SSRx/iT-p-g)' 


其中分 = s + p + 1. 


(4.44) 


在线性和正态性假定下，它服从自由度是 s 和 r - P - g 的厂分布. 

注释： 因为# (对 Ar = 2 ,.‘.，s + l ) 与以及它们自身之间趋向于有高 
度相关性，所以用 M t - x 的与 X ,—、 没有线性关系的主成分对 (4.43) 式进行拟合. 
主成分分析是一种降維的统计工具，参见第8章的更多内容 口 

K^nan (1985) 提出了一种对时间序列的非线性检验 方法. 此方法只用到； if 
并且修正了 RESET 检验法的第二步来回避好和 X,. l 之间的多重共线性 ( mul - 
ticollinearity). 特别地， (4.43) 式的线性回归分成两步•在 2(a) 步，通过拟合回归移 
除赶对 X ,^ 的线性依赖关系 


xf = X' t 1 0 + u t , 

得到 残差〜 夂在 2(b) 步，考虑线性回归 


d t = u t a -f- vt, 

得到平方残差和 f ： (a t -u ( <i) 2 = Z 吋来检 验原假设 0 = 0. 

t=p*f 1 t=p*f 1 
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F 检验 

为了改进 Keenan 的 RESET 检验的功效. Tsay (1986) 选择了不同的回归量 
M t - X . 特别地，他建议使用 Af t -j = vcchiXt ^ X ^^), 其中 vech ⑷表示矩阵义 
的半拉直向量，即 A 对角线及其下面的元素组成的向 M ， 具体可参见第8章的附 
录 B. 例如，当 p = 2时， M,_i - •对 AR(p) 模型， M 卜 上的 

维数是 p(p+ 1)/2. 在实际中，这个检验法就足对如下线性最小二乘回归用普通偏 
F 统句量来检验 a =0： 


— • X ' t — 1少 + 

其中是误差项.在 x t 是线性 AR(^) 过程的假定下•偏 F 统计量服从一个自由 
度为 g T - p - g -1 的 F 分布，其中 i/ = z 办十 1)/2. 我们把这种 F 检验称为 
On-F 检验. Luukkoneu, Saikkoneri 和 Terasvirta (1988) 进一■步发展 /这个检验法， 
将 iWn 增加到了有三次项 (对* =i，...，p). 


门限检验 

在研究中，当备择模型是 SETAR 模型时，人们总可以选具体的检验统计量来 
增加检验的功效这些具体的检验统计量之一就是似然比统计量.不过，这个检验 
遇到了在线性的原假设下没有定义参数的困难.这是因为对线性 AR 过程门限是没 
有定义的.另一神貝体的检验试图将检验门限非线性转化成探测模型的变化.对门 
限非线性讨论这两种方法的区别很有趣. 

为简化讨论.让我们考虑一个简单的例子.备择模型是门限变量为的2 
体制 SETAR 模型.原假设是机 •• a 服从线性 AR { p ) 模型 

P 

xt ~~ </>o + ^ + (4.45) 

t=i 

而备抒假设是 i/ u : ar t 服从 SETAR 模型 

0o l) •+• 5^ W 1 )%—i + a u ， 若 

i=i 

= < p 

^0 2) + ^2 + fl2t, 若 

‘ i=l 

其中 n 是门限.对给定的实现值 { x t ) T ^ 假定它是正态的并令/ 0 (忒 W) 为对 
数似然 函数. 它是以冷-(如，•••，％)'和4的最大似然估计计算得到的•这 
很容易计算.如果给定门限 n， 那么在备择条件下似然函数也是易于计算的•令 

为对数似然函数，它是在知道门限 n 的条件下，由 ^ = (4°,---, 
0^/和 < 的最大似然估计计算得到的.对数似然比定义为 

l{ri) = /i(ri ； 0,,aj;0 2； ^) -/ 0 (0.^). 


x t -d < n, 

(4.46) 

•^ t—d ^ ^*1» 
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它是未知门限 n 的函数.然而在原假设下，并没有门限而且 n 没有定义.在原假设 
h 参数 n 称为讨厌参数 (nuisance parameter ). 因此似然比的渐近分布与通常的似 
然比统计量有很大 不同. 可以参见 Chen (1991) 以获得更多的细节和这个检验的临 
界值 (critical value ). —个通常的做法是取 / max = sup t;<rj<tl /( n ) 作为检验统计量, 
其中 U 和 u 是事先指定为门限的下界和上界. Davis (1987), Andrews 和 Ploberger 
(1994) 更进一步地讨论了原假设下含讨厌参数的假设检验.榄拟法经常用于获取 
柃验统计量 / max 的经聆临界值，而依赖于《和》的选择 /( r ,) 在 n e [v, u] 
上的平均值也被 Andrews 和 Ploberger 考虑作为检验统计量. 

Tsay (1989) 利用排序自回归 （arranged autoregression ) 和递归估计得到另外一 • 
个门限非线性的检验.在备择假设队下，排序自回归试图将 SETAR 模型问题转 
变成一个模型改变问题，其改变点就是门限为说明这点， (4.46) 式的 SETAR 模 
型是说 A 实质上服从两个线性模型，分别依赖丁 • x t d n 或^ n . 对实现 
值 工 t-d 取值 { ii ， …，工 r - d } •令： c ( i ) ^ x (2) < …< x ( T _ d 、为 ^ 

列好的数据（比如将这些观测值按递增的顺序排好).这样 SETAR 模型可写成 

V 

工 (j)+d = 3o + + a (j)^dy j = h …， T 一 d ， (4.47) 

鲁 

其中当 ％) < n 时 A = 0! '当： r ⑴彡 n 时汰 = 4 2 ). 从而，门限 n 是 （4.47) 式 
线性回归的改变点，我们称 (4.47) 式为排序自回归（门限是递增顺序的).注 
意到 (4.47) 式的排序自回归并没改变 z , 对: r ,_ ，(对 i = 1，_.. , p ) 的动态依赖性，这 
是因为 x ijHd 仍然依赖于 x U )+ d _ i{M i = 1,…， p ). 上面完成了将 SETAR 模型放 
到门限空间中以代替时间空间.这就是说，带有较小的; r t _ d 的式子会出现在带有 
较大 A d 的式子之前 . Tsay (1989) 的门限检验如下. 

第1步用 j = 1,…， m 拟合 （4.47) 式，其中 m 是事先指定的正整数（比如 
30). ^ A 的最小二乘估计是戌, m ; 其中 m 表示用于估计的数据点个数. 

第2步计算预测残差 

P 

在 (m+l) + d = T(m I 1) I d — fto,m — ^ 百 i ， m^( m +l) 十 d-i 

1=1 

和它的标准误差•令 e ( m +1)+ d 为标准化的预测残差. 

第 3 步用递归最小二乘法去修正最小二乘估计忒. m+i ， 它是通过合汁新数 
据点 a ^( m + i )+ d 实现. 

笫4 步重复第 2, 3步，直至所有数据点都处理过. 

第5步考虑标准化的预测残差的线性回归 

v 

e(m+j)+d = «=0 + / . Q: ^(m+j)+d-t I v t ，j = !,•■ ,T — d — m, (4.48) 
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并计算通常的 F 统计量以检验 (4.48) 式中的^ = 0(* = 0,..- , p ). 在 a 服从线性 
AR ( P ) 模型的原假设下, F 比率的极限分布是一个自由度为 P +1 和 T - d - m- r 
的 F 分布. 

我们称上面的 F 检验为 TAR-F 检验. 这个检验背后的思想是，在原假设下 
(4.47) 式的排序自回归中没有模型改变.所以标准化的预测残差应该接近均值为 （】 、 
方差为1的独立同分布的随机变量.在这种情况下，那些标准化的预测残差应该与 
冋归值 ： r (m+ &以不相关.要了解更多关丁-递归最小二乘法和 TAR-F 检验表现的 
模拟研究的细节.请参见 Tsay (1989). TAR-F 检验回避/似然比检验中遇到的 t 寸 
厌参数问题.它不要求知道门限 n 并且只是简单地柃验了在原假设下预测残差与 
回归值的不相关性 • 因此.这个检验不依赖于一定要知道备择模型中体制的数目- 
但是如果真实模型确实是有己知更新分布的 2 休制 SETAR 模型，那么 TAR-F 检 
验的功效不如似然比检验. 


4.2.3 应用 

本节把先前讨论的一些非线性检验应用到5个时间序列中.对一个真实的金 
融时间序列， 一般用 AR 模型移除数据中的相关成分.然后将检验用到模型的残差 
序列中.这5 .个序列如下. 

(1) r lt ： 500个观测值组成的独立同分布的、服从 N (0,1) 的模拟序列. 

(2) r 2 f ： 独立同分布的，服从自由度为6的 f 分布的模拟序列，样本容量是 5 卻. 

(3) a ： u ： 1926年到1997年的 CRSP 等权重指数月对数收益率的86 4 个观测值 
的残差序列.用到的线性 AR 模型是 


(1 - 0.18() 丑十 0.0995 3 - 0.105 i ? 9 ) r 3 t = 0.008 6 + a 3t . 

(4) a 4e ： 1926年到1997年的 CRSP 的价值加权指数月对数收益率的864个观 
测值的残差序列.用到的线性 AR 模型是 

(1 - 0.098Z? 十 （ ).11 1/? 3 0.088f? 5 )7- 4f = ().007 8 十 a 4( . 

(5) a 5< ： 1926年到1997年的 IBM 股票月对数收益率的864个观测值的残差 
序列_用到的线性 AR 模型是 

(1 - 0.0775) r r>t = 0.011 + a 5t . 

表 4~2 是非线性检验的结果.对模拟序列和 IBM 收益率， F 检验是建立在 AR(6) 
模型的基础上的.对指数收益率， AR 的阶与前面的模型样.对 BDS 检验，我们 
选择 rt =& a 和 A = 1.5CT a ,A 取 2 .…， 5. 表中还给出了 Ljung-Box 统 i| 量以确定在 
应用非线性检验前残差序列没有序列相关性.与它们的渐近临界值比较. BDS 检验 
和 F 检验对模拟序列在5%的水平下是不显著的.不过对真实的金融时间序列而 
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言 ， BDS 检验却是高度显著的 . F 检验对指数收益率也显示出了显著的结果.但它 
们没有检验出 IBM 对数收益率的非线件.总之.这心枪脍证明了槙拟序列是线件 
的并认为股票收益率是非线性的. 


表 4-2 对模拟序列和一些股票对数收益丰的非线性检验 | 


数据 

Q 

Q 


BDS (S : 

= 1.5a n ) 


(5) 

(10) 

2 

3 

4 

5 

離 1) 

3.2 

6.5 

().32 

-0.14 

-0.15 

0.33 


0.9 

1.7 

-0.87 

-1.18 

-1.56 

-1.71 

ln(ew) 

2.9 

4.9 

9.94 

11.72 

12.83 

13.65 

ln(vw) 

1.0 

9.8 

8.61 

9.88 

10.70 

11.29 

ln(ibm) 

0.6 

7.1 

4.96 

6.09 

6.68 

6.82 

数据 

Ori-F 

d = 1 


BDS (<J = a a ) 


TAR-F 

2 

3 

4 

5 

輝， l) 

1.13 

0.87 

0.77 

-0.71 

-1.04 

1.27 

to 

0.69 

0.81 

-0.35 

-0.76 

-1.25 

-1.49 

la(ew) 

5.05 

6.77 

10.01 

11.85 

13.14 

14.45 

ln(vw) 

4.95 

6.85 

7.01 

7.83 

8.64 

9.53 

In(ibm) 

1.32 

1.51 

3.82 

4.70 

5.45 

5.72 


a 揆拟序列的样本存 S 是500,股栗收益率的样本容1；足 S(i4. BDS 检验用 /t = 2, ••- ,5. 


4.3 建 模 


非线性时间序列的建模必须包含一些主观判断.不过，仍然要遵守一些总休上 
的准则.非线性检验开始时要建立在一个合适的线性模型的基础上.对金融时间 
序列， Ljm.g-Box 统计量和 Engle 检验通常用于检测条件异方差性.对一般序列, 
可以用 4.2 节的其他检验法.如果非线性在统计上是显著的，那么可选择接受一 
类非线性模型.这种选择可能依赖分析者的经验和研究问题的实质.对于波动率 
模型， ARCH 过程的阶是通过检査平方序列的偏自相关函数确定的.对 GARCH 
和 EGARCH 模型.在绝大多数应用屮，只考虑如同 (1,1), (1,2) 和 (2,1) 低阶的情 
况.更髙阶的模型很难估计和理解.对 TAR 模型， oj 以用 Tong (1990) 和 Tsay 
(1989,1998) 给出的步骤程序建立合适的模型.当样本容量充分大时,可以用非线性 
技术去探测数据的非线性因素，然后据此选择合适的非线性模型.具体可见 Chen 
和 Tsay (1993a) 以及 Cai, Fan 和 Yao(2000). Lewis 和 Stevens(1991) 的 MARS 程 
序也可以用来探测数据的动态结构.最后，像 Akaike 信息准则 (Akaike.1974) 这样 
的信息标准以及广义机会比 (Chen, McCulloch 和 Tsay (1997)) 可以用来区分候选 
的非线性模型.选定的模型在被用来预测前应该仔细检査核对. 

4.4 预 测 

与线件模型+同，当预测长度大于1时，对绝大多数非线性模型，计算其预测 
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值并没有显示表达公式.我们用参数自助 (parameric bootstraps ) 法计算非线性预 
测值.我们很容易理解，模型在用于预测前需要严格的检査以判断对所研究的序列 
是否合适.通过一个模型.我们可以了解动态结构和新息分布.在某些情况下，我们 
可以把估计的参数看作已知的. 

4.4.1 参数自助法 

令 r 为预测原点，/为预测步长 u > 0). 这就是说，我们处在时间指标 r 处 
并对预测 r Tll 感兴趣参数自助法计算实现值 ，- r.T tl 依次通过下面步 
骤： 00从模型指定的新息分布中重新抽取一个新的新息； 用模型、数据以及以 
前的预测 冗 r +1， …计算 这样得到的一"个实现值.重复这个过 

程 M 次来得到的 M 个实现值，并用 { x ^}^ 表示. x T+ , 的预测点就取 

也 的样本均值.令预测为 x T ( l ). 在一些应用中我们取 A / = 3 000,并且结果证明 

效果不错.实现值 y 也可用于获得 irw 的经验分布.我们稍后利用经验 

分布去评估预测功效. 

4.4.2 预测的评估 


评佔模型的预测功效有很多方法，从方向度量到大小度量再到分布度量.力向 
度量考虑由模型可推知的将来的殳动方向（上升或下降).预测明大的 S&P 500指 
数将要上升或卜降是一个有实杯意义的方向顸测的例十. M 测年终 H S&P 500 指 
数的价值属于大小度 M 的例子.最后，评估从现在到年终的日 S&P 5()0 指数将上升 
1()%或更多的可能性要求知道将来该指数的条件概率分布.而评估这样一个估价的 
精度则需要分布度量. 

在实际中，可利用的数据集被分成两部分子样本.第一部分子样本的数据用来 
建立一个非线性 模型； 第二部分子样本用来评估模型的预测功效.我们称这两部分 
子样本分别为估计子样本和预测子样本.在一些研究中，常使用滚动预测程序.当 
预测原点前进时，一个新的数据点从预测子样本转移到估计子样本中.下面我们将 
简要地讨论文献中一&通常用到的预测功效的度量方法.不过要记住的是在比较 
模型优劣时不存在单独地被广泛接受的度量方法.为了更好地了解这种比较，可能 
需要一个基于预测目的的效用函数. 

方向度量 

一个典沏的度最法是用一个2 x 2的列联表來总结在预测子样本中预测 x T+ , 
_ h 升和下降的相对应的 模勒的 “击中“ （ hit ) 和“丢失" ( misse ) 数目.具体说来.列 
联表如下给出 
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实际 | 预测 

下 

7fM2 mm 
爪 22 rri20 

77102 Tfl 

其中 m 是预测子样本中/少向前预测的总数目 . m u 是预测向丄运动且击中（预测 
正确）的数日， m 21 是预测市场向下运动且丢失（预测错误）的数目，依次类推 . m n 
和 m 22 有较人值意味着较好的预测.其检验统计童 



可以用米评估这个模型的功效.大的 X 2 值表示该模型优于随机选择的机会.在一 
些适度的条件卜 . X 2 渐近服从自由度为1的X 2 分布.有关这祌度量的更进一步讨 
论见 Dalil 和 Hylleberg(1999). 

作为方向度量的例子，考虑图 4-9 中的 8-4-1 前馈神经网络的1步向前概率预 
测.这个网络的击中和丢失的2 x 2表格是 


实际 

预测 


上 下 


上 

12 2 

14 

K 

8 2 

10 


20 4 

24 


这个表显示了该网络对向上运动的预测不错.但对股票向下运动的预测不理想.这 
个表格的X 2 统计量是 0.137, p 值是 0.71. 从而，网络并没有显著地优于一个对向 
上向下等概率的随机游动模型. 

大小度量 

有3个统计量经常用丁度量点预测的功效.它们是均方误差 （ MSE )、 平均绝 
对偏差 （ MAD) 和平均绝对百分比误差 （ MAPE). 对；步向前预测，这些度量定义 
如下 


mse (o=4e [财刪 - w ， )i 2 , 

J=0 

(4.49) 

- m— 1 

MAD(0 = — |jrr + t +J - ■E7 '+j-(0 |， 

1 j=0 

(4.5U) 

MAPE(Z) = 1 V 乃， +j(/) 

(4.51) 


其中 m 是预测子样本中可用于 f 步向前预测的数目.在应用中，人们通常选择上 
面3种度量之一.这种度量取值最小的模型被认为是最好的/步向前预测模型 . / 
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的不同可能会导致选用不同的模型.这些度量在模型对比中仍然有其他的局限性. 
具体可参见诸如 Clements 和 Hendry (1993) 的文献. 


分布度量 


从业人员最近幵始用预测分布來对一个模型的预测功效进行评佔.严格来讲， 
预测分布融合了预测时参数的不确定性.如果参数可看作固定的话，我们就称它为 
条件蚀测分布.通过参数自助法得到的 x T + i 的经验分布是一个条件预测分布.这 
个经验分布通常用于计算分布度量.令 u T ( l ) 为观测值 xtm 在前面 所述经验分布 
中的分位数.我们有一个 m 个分位数 { u ^^/)}^ 1 的集合，其中 m 是预测子样 
本中 f 步向前预测的数目.如果接受的模型合适的话， { u r + J (0} 应该是服从 [ O.ij 
上均勻分布的一个随机样本.对一个充分大的 m ， 可以计算服从 [0 ，lj 上均勻分布 
的卜 r + j (⑴的 Kolmogorov - Smirnov 统计量.这个统计量可用于模型的检验和预 
测的比较. 


4.5 应 用 

本节通过分析1948年到1993年经 季节凋 整后的每季度美国平民失业率来说 
明非线性时间序列模型. Montgomery , Zarnowitz , Tsay 和 Tiao (1998) 详细地分析 
过这个序列.这里我们用非线性模型重复他们的一些分析内容.图 4-11 是数据的 
时间阁.这个序列明显的特征包括 ： （ a ) 倾向于与美国商#周期相反周期性 ： （b) 失 
业率上升时很快，下降时却很慢 . （h) 特征说明该序列的动态结构是非线性的. 



图 4-11 从1948年到1993年每季度美国失业率（经季度调粮后）的 时问阉 

记该序列为; Tf 并且令 = xt — x t ~ i 为失业率的变动值. Montgomery 等人 
(1998) 建立了线性模型 


(1 - 0.31^)(1 - 0.65 S ) Ax t = (1 - 0.78 B 4 ) a t , = 0.090, 


(4.52) 
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其中三个系数的标准差分别为 0.11,0.06 和 0.07. 里然数据经过了季节调整，伸模型 
还是呈现/季节性.这说明季节调整并没有成功地移除季节性.我们把这个模型当 
作预测比较的基准模型. 

为检验非线性.我们对由差分序列建立的 AR (5) 模型进行 4.2 节中介绍 
过的一些非线性检验.结果在表 4-3 中给出.所有的检验法都拒绝了线性假设.实 
际上.已经拒绝了所有使用 AH(/7)( 其中 P-2, -- .10) 模型的线性假设. 


表4>3 1948年第二季度到1993年第四季度的美国季度失业率变化的非线性检验 1 


类型 

Ori-F 

LST 

TAR(l) 

TAR(2) 

TAR(3) 

TAR ⑷ 

检验 

2.80 

2.83 

2.41 

2.16 

2.84 

2.98 

P 值 

0.000 7 

◦•000 2 

0.029 8 

0.050 0 

0.012 1 

0.008 8 


a 使用 AR(5) 棋型， LST 表示 Luukkonen 等人 (1988) 提出的检验， TAR(d) 指的是延迟为 d 的门 
限检验 . 


用类似于 Tsay (1989) 的建模程序， Montgomery 等人 （1998) 对序列建立 
了卜面的 TAR 模型： 


Axt = 


().01 - f - - f - (). 10 △: r <_2 + 

0.18 -|- —2 I ^2t .» 


如果 Aj ： t _2 < ().1, 
否则. 


(4.53) 


叫和吻的样本方差分别是 0.76 和 0.165, 体制 I 的三个系数的标准差分别是 
0.03. 0.10 和 0.12; 体制2的三个系数的标准差则分别是 0.09, 0.1 和 0.16. 这个模 
型说明了美国季度失业率的变化值△: r , 在 x ,_ 2 _ x ,_ 3 的门限为0.〗的基准宇间中 
很像一个分段线件模铟.肓观上，该模沏暗示了随着最近失#率的改变失业人数的 
表现是不同的在第一个体制下，失业率下降或有轻微的上升.这样经济应该是稳 
定的.实质上变动率服从一个简单的 AR (1) 模型，因为2阶延迟系数是不显著的. 
在第二个体制下，失业率 （0.1 或更大）有一个大幅跳跃.这典型地与经济周期的紧 
缩期相对应.而且这个时期可能发生政府干预经济以及产业结构调整.这里服 
从一个带正常数项的 AR (2； 模型.显示了心向上的趋势.这个 AR (2) 多项式有两 
个复特 征根. 显示了 可能的周期行为.从而 .而 出现转折点的可能性增人.意 
味着: r , 大幅增长的时期会很短.这意味着美国经济的紧缩期比扩张期要短些. 

Montgomery 等人 (1998) 用马尔可夫链蒙特卡罗 (Markov Chain Monte Carlo ) 
力法得到下面关于 △./：, 的马尔可夫转换 模型： 

A f —0.07 + 0.38Aa"t— 1 - 0.05Ax<_2 + £\ti 如果沒 t 一 1, . 、 

/\xt = \ (4.54) 

I 0.16 + 0.86A«rt-1 — 0.38 △: Tf_2 + ^2 ti 如果 = 2. 


的条件均值当 〜=1 时是 -0.10. 当 . s < = 2 时是 0.31. 从而.第一个状态表示 
经济的扩张期，第二个状态表示经济的紧缩期 . 和 e 2 , 的样本方差分别是 0.031 
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和 0.192. 在状态= 1时,三个参数的标准差分别是0.03, 0.14 和 0.11, 而在状态 
= 2时，它们则分别是0.04, 0.13 和 0.14. 状态转移概率是/^ = 2| s t _i = 1) = 
0.084(0.060) 和 P ( s t = l|s,_, = 2) = 0.126(0.053), 其中括号里的数字是对应的标 
准误差.这个模型说明在第二个状态下，当 AR (2) 多项式有复特征根时，失业率^ 
有向卜的趋势.模型的这个特征很像 (4.53) 式的第2个体制的 TAR 模型.在第一 
个状态下，失业率^有带弱得多的自冋归结构的轻微的下降趋势. 

预测功故 

Montgomery 等人 （1998) 用一个滚动程序预测失业率该程序如下 . 

(1) 以 T = 83为预测原点，该点对应于 1968. II . 它在文献中用于监视各种预 
测失业率的模型的功效.用从 1948. I 到预测原点（包括预测原点）的数据估计线 
性、 TAR 和 MSA 模型. 

(2) 进行1季度和5季度的向前预测并计算每个模型的预测误差.对非线性模 
型的预测使用 4.4 节中的参数自助法. 

(3) 预测原点向前移1步.然后重复估计和预测过稈.肓到毎个数据都使用过. 

(4) 用 MSE 和平均预测误差来比较模型的功效. 

从表 4-4 可以看到 (4.52) 式的线性模型， (4.54) 式的 TAR 模型和 (4.54) 式的 
MSA 模型预测的相对 MSE 和平均预测误差.此处用线性模型作为基准.比较是基 
子总体表现和在预测原点美国的经济状况.从这张表格中，我们观察到下面的结论. 

(1) 总体上比较， TAR 模型和线性模型的 MSE 非常接近.但 TAR 模型的偏差 
更小.而 MSA 模型有最大的 MSE 和最小的偏差. 

(2) 当预测原点在经济紧缩期 B 、 j . TAR 模型无论是 MSE 还是偏差都比线性模 
型表现得要好. MSA 模型也比线性模型好，但没有 TAR 模型好得那么多. 

(3) 当蚀测原点在经济扩张期时，线性模型比两个非线性模型要好. 

结果表明了当美国经济处于紧缩期时.在预测美国季度失业率上非线性模型的 
表现超过线性模型.这并不奇怪，因为就像前面提到的，在经济紧缩时政府会干预 
经济并且会进行产业结构调整.这些外部事件引起了美国失业率的非线性.直观 
上，这样的改进很重要.因为在经济紧缩期，人们会更关注经济预测. 


表 4-4 对美国季度失业丰用线性、 TAR 和 MSA 模型的祥本外预测的比较 a 


模型 


预测的相对 MSE 


1 步 

2 步 

3 步 

4 步 

5 步 

总体比较 

线性 

1.00 

1.00 

1.00 

1.00 

1.00 

TAR 

1.00 

1.04 

0.99 

0.98 

1.03 

MSA 

1.19 

1.39 

1.40 

1.45 

1.61 

MSE 

0.08 

0.31 

0.67 

1.13 

1.54 
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(续） 

模型 



预测的相对 MSE 



1步 

2步 

3步 

4步 

5步 



经济紧缩时的预测原点 



线性 

1.00 

1.00 

1.00 

1.00 

1.00 

TAR 

0.85 

0.91 

0.83 

0.72 

0.72 

MSA 

0.97 

1.03 

0.96 

0 

1 02 

MSE 

0.22 

0.97 

2.14 

3.38 

3.46 

经济扩张时的预测厣点 

线性 

l .( X ) 

1.00 

1.00 

1.00 

1.00 

TAB 

1.16 

1.13 

1.10 

1.15 

1.17 

MSA 

1.31 

1.64 

1.73 

1.84 

1.87 

MSE 

0.06 

0.21 

0.45 

0.78 

1.24 

预测误差的均值 

总体比较 

线性 

0.03 

0.09 

0.17 

0.25 

0.33 

TAR 

•0.10 

-0.02 

- D .03 

0.03 

-0.01 

MSA 

0.00 

0 02 

-0.04 

0.07 

-0.12 

经济紧缩时的预测原点 

线性 

0.31 

0.68 

1.08 

1.41 

1.38 

TAR 

0.24 

0.56 

0.87 

1.01 

0.86 

MSA 

U .20 

0.41 

0.57 

U .52 

0.14 

好济扩张时的预测原点 

线性 

0.01 

0.00 

0.0：^ 

0.0 R 

0 17 

TAR 

0.05 

-0.11 

-0.17 

-0.19 

0.14 

MSA 

-0.03 

0.08 

-0.13 

乜17 

-0.16 


a 预测原点是1968年第2 f 度.用 “ MSE ” 标记的行表示基准线性模型的 MSE (均方误差). 


附录 A —些关于非线性波动率模型的 RATS 程序 

用于给 IBM 股票日对数收益率建立 AK (2)- TAR - GARCH (1,1) 模型 
数据文件是 d - ibmln 03. txt . 

all 0 10446:1 
open data d-ibmln03.txt 
data(org=obs) / rt 
set h » 0.0 

nonlin mu p2 aO al bl a2 b2 

frml at - rt<t)-mu-p2*rt(t-2) 

frml gvar = aO + al*at(t-l}**2+bl*h(t-1) $ 

+ %if(at(t-l) < 0,a2*at(t-l)**2+b2*h(t-l>, 0 ) 
frml garchln = • 5 食 log (h (t) =gvar (t) }-0 • 5*at **2/h (t) 

smpl 4 10446 

compute mu = 0.03, p2 = -0.03 

compute aO = 0.07, al = 0.05, a2 = 0.05, bl = 0.85, b2 = 0.05 









174 第 4 章非线性模型及其应用 


maximize(method=simplex,iterations=10) garchln 
smpl 4 10446 

maximize(method=blihh , recuroive,iterations=150) garchln 

set fv = gvar(t) 

set resid = at(t)/sqrt(fv(t)) 

set residsq = resid(t)*resid(t) 

cor(qstats f number=20 # span=10) resid 

cor(qstats # number=20,9pan=10) residsq 

用于给 3 M 股票月简单收益率建立一个平滑的 TAR 模型 
数据文件是 一 mmm.txt 9 . 

all 0 623:1 
open data m-mmm.txt 
data(org=obs) / mmm 
set h = 0.0 

nonlin ao a 丄 a2 aOO all mu 
frml at = mrran(t) - mu 

frral varl = a0+al*at(t-1)**2+a2*at (t-2)**2 
frral var2 = a00+all*at(t-l}**2 

f rml gvar =» varl (t) +var2 (t) / (1.0+exp (-at(t-l)*1000.0)) 
f rml garchlog = -0.5* log (h (t) =grvar (t) ) - 0.5* at (t) **2/h(t) 
smpl 3 623 

compute aO = .01, al = 0.2, a2 = 0.1 
compute aOO = .01, all = -.2 # mu = 0.02 

maximize (method=bhhh, recursive , iterations=*15 0) garchlog 

set fv = gvar(t) 

set resid = at(t)/sqrt(fv(t)) 

set residsq = resid(c)*resid(t) 

cor(qfltatR # numher=^0,span=10) resid 

cor(qstats,number=20,span=10) residsq 

附录 B 神经网络的 S - Plus 命令 

以下 S-Plus 命令是用来建立例 4.7 中的 3-2-1 跳跃层的前馈网络.带“: T 号 
的行是注释.数据文件是 * c-ibmln. txt } . 

# load the data into S-Plus workspace. 
x 一 scan(file= # m-ibmln.txt 9 ) 

H select the output: r(t) 
y 一 x [4 •• 864 】 

# obtain the input variables : r(t-l), r(t-2) # and r(t-3) 
ibm.x_cbind(x[3 ： 863] ,x [2 ： 862] ,x[l: 861]) 

# build a 3-2-1 network with skip layer connections 

# and linear output. 

ibm.nn_nnet{ibm.x,y,size=2,linout=T,skip=T r maxit=10000 # 
decay=le-2,reltol=le-7,abstol=le-7 # range=1•0) 

# print the summary results of the network 
summary(ibm.nn) 

# compute \& print the residual sum of squares. 
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sse_sum( (y-predict (ibm.nn, ibm.x) ) A 2) 
print(sse) 

fteigen(nnet.Hess(ibm.nn,ibm.x,y),T)$values 

# setup the input variables in the forecasting eubcample 
ibm.p_cbind(x[864 : 887] # x[863:886],x[862:885]) 

# compute the forecasts 
yhjpredict: (ibm.nn # ibm.p) 

U Thft ohsp.rvRd in t:hf> forecasting flubnampl r 

yo—x[865:888] 

# compute \& print the sum of squares of forecast errors 
ssfe — sum (( yo - yh ) x 2) 

print(ssfe) 

# quit S-Plus 

q () 

练习题 

4.1 考虑约翰兄弟公司股票从 199() 年 1 月到2003年12月的日简苹收益率.数据放在文件 
d - jnj 9003. txt 中，也可以从 CRSP 得到.把收益率转化为对数收益率，并以百分比形式 
给出. 

( a ) 给对数收益率序列建立一个 GJR 模型.并写下所拟合的模型.在1%的水平下存在 
杠杆效应吗？ 

( b ) 给对数收益率序列建立一个一般的门限波动率模型， 

( c ) 比较两个 TGAHCH 模型. 

4.2 考虑通用电气 （ GE ) 股票的从 192(5 年1月到2003年12月股紫的月简苹收益率.你可 
以从 CRSP 下载数据或使用网上的文件 m - ge 2603. txt . 把收益率转化为对数收益率，并 
以百分比形式给出.设 0,-1 是/ - 1 刻的扰动，给上述数据建立一个以 at -, 为门限变 

ft、 0为门限的带 GED 新息的门限 TGARCH 模型，并写下所拟合的模型.在5%的水 
T 下存在杠杆效应吗？ 

4.3 假设 GE 股票的月对数收益本（以百分比形式）服从一个平滑的门限 GARCH (1, 1) 模型. 
对样木时间区间为1926年1月至1999年1；2月的数据，拟合的模型为 

rt = 1.06 4- at , a ； = 

nf = 0 103«?_! + 0 952ct； 2 _j -|- --- ^(4 49(1 - 0.193<t?_,), 

1 + exp(—10at 一 l) 

其中所有的佔计值都是髙度 M 著的； 指数中的系数10是事先给定的，以便简化估计过程: 
{£■»} 是独立同分布、服从 N ( Q , 1) 的序列.假设 a 賴 = 16.0 和 <risa = 50.2. 1步向前波 
动率预测值斤| 88 ⑴是什么？如果换成叫 88 = -1 G .0, 那么1步向前波动率预测值^ 88 (1) 
又是什么？ 

4.4 假设一支股梨的月对数收益弔（以百分比形式）服从如下的马尔可夫体制转换 模型： 


Vi = 1 25 -f n ti a t = rr t e t ^ 

2 _ I 0.10a?_, + 0.93<T t 2 _, t 如果 A ，1， 

' \ 4.24-f0.10a? , +0.78 <t?,, 如果 & =2, 
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其中转移 概申为 

P(»t = 2 \ st-i = 1) = 0.15, P(st — l | st_j = 2) = 0.05. 

假设 «ioo - 6.0, crfoo - 50.0 并且以概率 1 有 .Mon - 2. 以 f 一 100 为预测原点的 1 步 
向前波动率预测值是什么？如果 s l00 = 2的概率减小到 0.8, 那么以 t = 100为预测原点 
的1步向前波动宇预测值又是什么？ 

4.5 再考虎通用电气 ( GE ) 股票的从192(> 年1月到2003年12月股票的月简单收益率用 
后三年的数据来进行预测 if •价. 

( a ) 用延迟收益率 n-h r ,_ 2 和 r t _ 3 作为输入值，给此收益率序列拟合一个 3-2-1 的前 
馈神经网络，并计算其1步向前预测及预测的均方误差. 

( b ) 用延迟收益率 r < _ l , r ,_ 2 ，「,_ 3 及其符号（方向）作为输入值，给此收益率序列拟合- 
个 6-5-1 的前馈神经 W 络，并预测1步向前 GE 股票价格运动的方向.其中1表示向 
上运动.计算 m 测的均方误差. 

提示：设 rtn 是 S - Plus 中的一个时间序列.为了得到该序列的方向变量，使用命令 drtn = 
ifelse ( rtn >0,1,0). 

4.6 因为在利李期限结构中#在逆收益曲线，所以利率差是非线性的.为 f 验证这个事实，我 
们考虑美国的两种周利率： （ a ) 1年期阆定期限国 库券； （ b ) 3 '牛期固定期限国库券.如 
第2章中一样，记这两 种利韦 分别力 ni 和 r 3 «. 数据的时间区间为1962 年丨月 5日到 
1999年9月10 □. 数据可从网上文件 w - gs 3 yr.txt 和 w - gslyr.txt 中得到，也<以从 
圣路易斯联邦储备银行•得到. 

( a ) 用〜= f 3t - r lt 表示对数利本 之差. {« f } 是线性的吗？进行非线性检验，开在5% 
的显著水平下得出结论 

(b) 用 a? = (rat — r34-i) — (r“ 一 ri.t-i) =取 一 表示利車差的变化 {s?} 是线性 
的吗？进行非线性检验，并在5%的显著水平 F 得出结论. 

(c) 对建立一个门限模型，并检验所拟合的模型. 

( d > 对建立一个门限模型，并检验所拟合的模型. 
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卨频数据是指在细小的 N 间间隔上抽取的观测值.金融中常指以日或更小的时 
间间隔抽取的观测值.由于数据的获得与处理方法的进一步发展，这些髙频数据目 
前是可以得到的，并且由于其在巾场微观结构实证研究方面的重要性而受到了广泛 
的关注.金融中最极端的高频数据是证券巾场中记录每一笔交易或贸易的数据•这 
里的时间通常以秒为单位测量.纽约股 票交笏 所的交易行情数据库包含了整理过 
的从1992年至今的所有证券交易的记录.它包括了在 NYSE 、 AMEX 、 NASDAQ , 
以及美 N 在纽约以外地区的证券交易所的交易数据.伯克利 ( Berkeley ) 期权数据 
库为期权交易提供了从 I 976 年 8 月至 I " 6 年 I 2 月的类似数据.对于国内外其他 
许多证券以及市场的交易数据都是连续收集和处理的 . Wood (2000) 提供了一些关 
于髙频金融研究的历史观察法 • 

高频金融数据在研究与交易过程和市场微观结构相关的大量问题中都很重要. 
可以用它们来比较不同交易系统（如 NYSE 的公开叫价系统和 NASDAQ 的计算机 
交易系统）在价格发现 (price discovery ) 方面的有效性：还可以用他们来研究某只 
特定股票买卖报价的动态性（如 Hasbroiirk : 1999； Zhang , Russell 和 Tsay , 2001 b ). 
在-个指令驱动的股票市场（如台湾股市交易所）中.高频数据还可以用来研究指 
令动态，更有趣的是可以用它们来研究“是谁提供了市场的流动性”这样的问题 • 
Cho , Russell , Tiao 和 Taay (2003) 利用在台湾股市交易所中交易的 34 【）多只股票 
在一入中每5分钟的收益率研究了设定日股价上下限的影响，并发现了向股价上 
限趋近磁效应的显著证据. 

然而，高频数据还有一些低频数据中不会出现的独特 特征. 因此对于这些数据 
的分析就给金融经济学家与统计学家提出了新的挑战.本章主要研究这些特殊的特 
征.考虑分析高频数据的方法并讨论所得结果的应用 • 特别地，我们讨论了非同步 
交易、买卖报价价差 ( bid-ask spread )、 持续期模型、大量小间隔上的价格运动以及 
关于价格变化和与价格变化相关的交易之间的时间持续期的二兀模型 • 所讨论的 
这些模型在其他科学领域（如通信和环境）的研究中也是适用的. 

5.1 非同步交易 

我们以对非同步交易的讨论开始.股票交易（如同 NYSE 中的-样）并不是同 
步发生的，不同的股票有着+同的交易频率；即使是同一种股票，其交易强度也是 
一小时一小时、一天一天地变化的.然而我们经常是对一个固定的时间间隔如一 
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天、一周或者一个月来分析收益率序列.对于日收益序列，股价指的是其收盘价格. 
即该股票在一个交易日内最后一次交易的价格，而股栗最后一次交易的实际 B 、 j 间也 
是一天天变化的.这样，如果我们假定口收益率序列在％小时里等间隔往往是不 
正 确的. 实践证明，这种假定可以导致，甚至是在真实的收益率序列是序列独立的 
时候.股票收益率可预测性的错误的结论. 

对于股票口收益率.非同步交易可 以导致 ： （ a ) 股票收益率之间的一步延迟交 
叉相关； （ b> 组合收益率的一步延迟序列 相关； （ c ) 某些情形下单只股票收益率序列 
的负序列相关.考虑股票4与从假定这构只股票是独立的，并且股票 j 比股票 
3 的交易频繁.对于在某天接近收盘时刻出现的一个特定的影响市场的消息，股票 
A 比股票"更可能在同一天中显示出这个消息的效应.这是因为 .4 的交易更频繁. 
该消息对股票的效应最终也会出现，但是可能会被延迟到下一个交易日.如果这 
种情况发生，则好像是股票乂的收益率引导着股票 S 的收益率•因此，尽管这两只 
股票独立，但是它们的收益率序列可能会显示出显著的一步延迟交叉相关件对干 

-个持有股票 >4与股票丑的组合，前面的交叉相关将会变成一个显著的一步延迟 
序列相关. 

更复杂的是.非同步交易也能引起单只股票错误的负序列相关.可以利用文献 
中的一些模型来研究这种现象.具体可参见 Campbell . Lo 和 MacKinlay (1997) 及 
其参考 文献. 这里我们采用 Lo 和 MmcK inlay (1990) 提出的模型的一个简化形式. 
令 r , 表示证券在/时刻的连续复合收 益韦. 为了简便.假定是一个独立同分布 
的随机变最序列，均值 E ( r t ) = 、方差 Var ( r f ) = a 2 . 对每个时间段，证券不交易的 
概率为 7 T ， 它不随时间变化，并且弓 0 独立•令 rf 表示观测到的收益率，如果 f 时刻 
没有交易•则 r ? - (), 因为此时没有可以利用的信息•如果 （ 时刻有一个交易，则我 
们 定义冲 为从前一个交易幵始的累积收益率 （也就 是说 ， r o = rt+r< _ 1 + ... + ， r ,_, ( . 

其中是满足在, — 心 ， i ~十1 ， ... ， f i 时刻没有交易发生的最大的非负整数 j 
与 rf 的关系用数学式子衮示 如下： 


0 , 

% 

n + r t 一 1, 

r t — n-i 十 n_ 2t 


以概率 7 T , 

以概率 (1 

以概率 (1 一 7 T ) 2 7 T ， 
以概率 (1 一 7 r ) 2 7 T 2 t 




r t - 


以概率 (1—7 T ) 2 7 r fc 


(5-1) 


这些概率很容易理解.例如 ，; rf = r •，当日仅当/时刻与 ，一 〗时刻都有交易 发生; 
r ' J = r * + r «-i, 当且仅当《时刻与《 - 2 时刻都有交易发生，但是/ 1 时刻无交易 
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发生； r o = rt + rt _ 1+ r ,_ 2 t 当且仅当 f 时刻与 t - 3 时刻都有交易发生，但是< _ 1 
时刻与 t -2 时刻无交易发生；等等 • 正如所期望的那样.总概率为〗，由下式给出 

7T + (1 — 7t) 2 [1 + 7r+TT 2 + ‘..l = 7T + U_ ^) 2 ^ = 7T+1_7T = 1. 

我们准备考虑观测的收益率序列{^}的矩 方程. 首先，叶的期望是 

E ( r ?)= (1 - 7 r ) 2 E ( r t ) + (1 - 丌 ) 2 7 rE ( r t + r t 一 i ) + … 

= (1 - ,) 2 " 十 （1 — ir) 2 ir2fi f (1 — 7r) 2 7r 2 3/i + ... 

(5 2、 

= (l-7r) 2 /4l + 27r + 37r 2 + 47r 3 + ...l • J 

= (i - ( T ^ = M - 


在上面的推导中，我们利用了结果： 1 + 27 T + 37 T 2 十 4 tT 3 + - — 下—步，对 

于汁的方差，我们利用 Var ( r «) = E [( r °) 2 ] - [ E(rf )] 2 ,以及 

E ( rf ) 2 = (1 - 7 r ) 2 E [( r t ) 2 ] + (1 - 7 r ) 2 7 rE [( r t + r t X ) 2 1 + … 

=(1 - 7T) 3 [(ff 2 +M 2 ) + 7T(2 ct 2 + 4〆 ） + 7T 2 (3fT 2 +9/i 2 ) + ...] (5.3) 


(1 - 7r) 2 {/T 2 [l + 27T + 37T 2 + •••]} + " 2 [1 + 47T4 - 97T 2 + ... 1 } 



(5-4) 

(5.5) 


在方程 （5.3) 中，我们利用了在 n 是序列独立的假定下式 成立: 



= (fc + 1)< T 2 + [(fc + l )"] 2 . 


利用与方程 （5.2) 类似的方法,我们能够证明方程 （5.4) 的第一项可简化为对 
于方程 （5.4) 的第二项.我们利用恒等式 


1 + 47 T + 97 T 2 十 167 T 3 + ... = 



(1 -7T) 3 (1 - 7T) 2 


此恒等式吋以如下 推出令 

H = 1 +47T + 97T 2 + 167T 3 + ... 且 G = 1 *f 37T + 57T 2 + 77T 1 + . 


那么 （1 — 7 T)H = G 且 

(1 - tt)G = 1 + 27T + 2tt 2 十 27T 3 + ... 

= 2(1 + 7 T + 7 T 2 + *") _ 1 = 
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因此，从方程 （ 5.2.) 与方程 （ 5.5) 中可以得出 

Var(r?) = cr 2 ^ ^ _ i] _ ^ = ^ + 

.1—7 Tj 1 — 7 T v f 

下一步考虑什 n 的一步延迟自协方差.这里我们利用 

C ov (' r ? » r ?-i) = — E(rJ , )E(r[ ) _ 1 ) = E(»f?f_ 1 ) — ^, 

则这个问题简化为寻找 E ^ O . 注意到如果丨时刻无交易或者1时刻无交易 
或者/时刻与 （ - 1时刻都无交易.则 = 0. 因此,我们得到 



0 , 

rt ( r t -i + n - 2 ), 
n ( n-i + r t _ 2 + 7. t _ 3 )， 

k 

n ^2 r t - i 、 


以概率 27 T -7 T 2 ， 
以概率 (1—7 T ) 3 , 
以概率 (1 一 7 r ) 3 7 T , 
以概率 (1 — 7T) 3 7r 2 ， 

以概率 (1—7 T ) 3 7 T fc \ 


(5-7) 


总概率也是 1. 为了理解前面的结果，注意到 rfrf ^ = r t r ,_! 当且仅当在时刻 
< - 2 ,《 - 1和 f 有三个连续的 交易. 利用方程 （5.7) 以及对 j > 0. E ( r t r t _ 7 ) = 
E ( r t ) E ( r t _ j ) = fi \ 我们得到 


E ( r ? 7 ’？ I) = ( 丄 一 tt) 3 jE(r t 7>—d + TrEIrdrr l 4-r / _ 2 )]}4-7r 2 E 
=(1 — 7r) 3 " 2 [l + 27r I 3 开 2 + … ]=(1 — n)fx 2 . 



{ r 以的一步延迟自协方差为 


Cov(tH) = -7r/i 2 . 

假定"不为零，则非同步交易引起的 _ r ? 的一步延迟自相关系数由下式给出 


(5.8) 


Pi ( r ?) 


—(1 — 7T)7r" 2 
(1 — 7 r ) cr 2 -f 2- KH 2 


—般地，我们可以推广前面的结果，并且证明 


Cov(r t 0 , rp_ ; ) = -n 2 iv j , j ^ 1. 

一步延迟 ACF 的大小依赖于〜 n 与 < r 的选择.并且可以是真实的.这样，当 " # n 
时，非同步交易就导致了观测到的证券收益率序列之间的负自相关忡. 
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前面的讨论可以推广到一个包含 W 种证券的资产组合的收益率序列；见 Camp 
hell . Lo 和 MnrKinlay (1997 .第 3 章).在时间序列文 献中. 非同步交易对于单个证 
券收益率的效应等价于关于一个时间序列的随机的时间积累.此时不交易的概率 a 
控制了积累的机制. 

5.2 买卖报价差 

在某些股票交易所（如 纽约证 券交易所)，做市商在促进交易方面起了非常重 
要的 作用. 他们提供了市场流动性 (market liquidity ): 毎当公众有买卖的愿望时， 
他们随时都准备好进行买 或卖. 市场流动性是指能快速地、匿名地、几乎没有价格 
影响地5：卖相光数 S 证券的 能力. 作为提供流动性的回报，交易所赋了’做市商对证 
券的买卖双方传递不同价格的垄 断权. 他们以标价凡购买，以更高的叫价巧卖 
出（对公众来说， n 是卖出价格，几是买入价格）.价格差 a - n 称为买卖报价 
差.这是做市商获得报酬的主要 来源. 买卖报价差一般比较小，也就是一两个最小 
升降档 

头实报价差尽管数量上比较小，但是它的存在对于资产收益率时间序列的性质 
有几个重要的影响.我们这里主要讨论买卖报价弹性.即买卖报价差引起的资产收 
益率的一步延迟负序列 相关. 考虑 Roll (1984) 的简单模型.假定观测到的资产市场 

价格巧满足 Q 

= + (5.9) 

其中 S = P a - 1 \ 表示买卖报价差， P ,* 表示一个无摩擦市场中资产在/时刻的基 
木价值， {/,} 是一个独立的.服从等概率二项分布的随机变量序列（即以概率 0.5. 

= 1；以槪率0.5, / f = -1) .人可以解释为一个指令型的示性变量 • R 取1表示买 
方发动的 交易； 取1表示卖方发动的交易 • 换一种说法，模型可以写为 

_ f +5/2,以概率 0.5. 

Pt= 1 - S /2, 以概率 (1.5. 

如果 / y 不变，那么价格变化的观测过程为 

APt = (/< — (5.10) 

在方程 (5.9) 对于/,的假定下，我们有 E (/ t ) = 0, Var (/ t ) = 1. 从而可以得到 
E ( AP ,) = 0,而且 


Var(AP f ) = S 2 /2, 

Cov(AP,, AF(_t) = -5 2 /4, 
Cov(AP tl AP t ^) = 0, j > 1. 


(5.11) 

( 5 . 12 ) 

(5.13) 




因此 ，△乃 的自相关函数为 
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-0.5 ，若 j = 1, 
0. 若 j > 1. 


(5.14) 


这样买卖报价差就导致观测到的价格变化序列的一步延迟负相关，这在金融文献中 
一般称为买卖报价 弹性. 对此，我们可以从下面的直观意义上来理解.假定基本价 
格 a 等于 （ p „ + n )/ 2 , 那么巧就有厂„与几两种取值.如采前面观测到的价格 
为 Pa (较高的值)，则当前观测到的价格耍么不变，要么为尸 6 ,从而 AP , 要么为 （), 
要么为-<5;然而.如果前面观测到的价格为 n (较低的值)，则 am 要么为（)，要么 

为6\ 的一沙延迟负相关变得很明显.但是，买卖报价差并小会引起任何超过 

一少延迟的序列相关. 

—个更加现实的表示是假定服从随机游动，满足= /V - ，这 
形成/一个均值为0,方差为 W 的独立同分布的随机变量序列，并且 { e t } 与 {/ t } 
独立.在这种情 形下. Var(AP t ) = a 2 +5 2 /2, 但是 Cov ( AP t , AP t - j ) 是不变的.从 
而 

Pl(APt) = -sd < 0 ‘ 

虽然△巧的一沙延迟自相关的大小减小了，但是当 <5 ==兄- a > () 时，负效应 
还是存在的.在金融中，研究买实报价差的组成比较 有趣. 感兴趣的读者可以参考 
Campbell. Lo 和 MacKinJay (1997) 及其参考 文献. 

买实报价差的效应在组合收益率与多元金融时间序列中也是存在的我们考 
虑二元的情形，用: { Iit . lotY 表示二元指令型示性变量，其中 / lf 是第一种证券 
的不性变置，4是第二种证券的示性变量.如果与/ 2 ,是同步相关的，则买卖 
报价差可以引起负的一步延迟交叉相关. 


5.3 交易数据的经验特征 

令《，表示资产的第/次交易发生的时刻，它是从午夜开始以秒为单位测量的 
H 历时间.有几个变量与交易相关 ，如： 交易价格、交易量、盛行的买卖报价等等. 
“ 的集合与相关的度量一般称为交易数据.这胜数据有几个重要的 特征. 这咚特征 
当观测值随时间加总时不 存在. 下面我们给出一些特征. 

(1) 不等间隔的时间 区间： 交易 （如 交易所里面的股票 交易） 一般不是在等间 
隔的时间区间上发生的.这样观测到的资产的交易价格并不形成一个等间隔的时间 
序列.从而交易间的时间持续期变得非常重要，并且可能包含了关于市场微观结构 
(例如交易强度）的有用信息 

(2) 离散取值的 价格： 资产从一个交易到另外一个交易的价格变化只在最小变 
动价位的倍数中发生.在 NYSE 中，最小变动价位在 1997 年 G 月 24 日以前是 1/8 
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美元，2001年1月29日以前是1/16美元，在 2 001年1月 M 日，所有的 NYSE 
和 AMEX 股票都开始以小数为单位进行交易，闲此价格在交易数据中是离散取值 
的变量.在某些市场中，价格的变化也可能受监管者设定的条件的限制. 

(3) 日周 期或者 9 模式的存在： 在正常交易条件下，交易活动能够展示周期模 
式. 举例说.在 NYSE 中，幵盘与收盘时刻的交易比较频繁，而中午时间交易比较 
少， 导致 f “ U ” 型的交易强度.因此，交易之间的时间持续期亦呈现口循环模式 - 
’ （4) 一秒钟的多重 交易： 多重交易.甚至是具有不问价格的多重交易同时发生 
是可能的.这部分是由于时间以秒来测量，而在大量交易期间，这种时间长度可能 
还是太长的事实. 

为了描述这些特征.我们首先考虑从1的0年11月1日到1991年1月31曰 
的 IBM 交易数据.这些数据来自于 TORQ ( Trades , Orders , Reports and Quotes , 即 
交易、指令、报告、报价）数据集，具体可参见 Hasbrouck (1992). 共有 63 个交易 
曰，60 328次交易.为了简化讨论，我们忽略了交易日间的价格变化，集中讨论发 
生在东部时间早上9: 3(1 至下午4:⑻的正常交易时间里的交易.众所周知，头天 
晚上的股票收益宇与当天的收益率有显著不同，具体可参见 Stoll 和 Wluvloy (1990) 
及其参考文献.表 5-1 以百分比形式给出了价格变化的频率，其中最小变动价位 
为$1/8- $0.125. 从表中我们做出以下结论 • 


表 5-1 IBM 股票从1990年11月1日到1991年1月 3 1 日 
以最小变动价位的倍数变化的价格变化频率 


数鼠 (tick) 

<-3 

一 2 

-1 

0 

1 

2 

彡 3 

百分比 

0.66 

1.33 

14.53 

67.06 

14.53 

1.27 

0.63 


(1) 大约2/3的日交易是没有价格变化的； 

(2) 一个最小变动价位的价格变化接近于 H 交易的29%; 

(3) 只有2.6%的交易与两个最小变动价位的价格变化相关； 

(4) 只有1.3%的交易导致三个或者更多个最小变动价位的价格变化： 

(5) 正负价格变化的分布是渐近对称的 • 

下面考虑每5分钟的时间间隔上的交易量•用 A 来表示此 序列. 也就是说，:^ 
表示在 1990 年 11 月 1 日， IBM 从上午 9: 30 至 9: 35 的交易量：;^表示 IBM 从 
上午 9 : 35 至 9: 40 的交易量， 等等. 忽略交易日之间的时间间隙•阁 5 -la 画出/ 
Xl 的时问 /T •列图.图 5 -lb 描述了: t t 延迟一阶至 26【) 阶的样本 ACF 尤其有趣的是 
ACF 的周期为 78 的循环模式，这正好是一个交易日内每 5 分钟间隔的数量这样, 
交易量呈现出円模式.为了更进一步地描述日交易模式，图 5 2 画出了 63 天的每 
5分钟的平均交易量.共有78个这样的甲均数.这个阁形呈现出“微笑”形状或者 
.‘ U ” 的形状，表明在市场幵盘与收盘的时候交易多，而亇时交易少的特点 • 
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MKH) 20()0 301X) 

「》分钟的时问区 M 

( 1 >) 


40(K) 50(1() 



51) 


100 150 

间陥 


2(H) 


260 


m 5-1 IBM 从1990年11月1日至1991年1月31日的日交易 数据: 
( a ) 每5分钟间隔内的交易 次数； （ b ) ( a ) 中序列的样本 ACF 



图 5 -2 毎5分钟间隔的平均交易次数的时间图对 IBM 股票从1990年11月1日 
至 1的1 年1月31日共 fi 3 个交易日的平均.共78个观测值 

因为我们着重讨论在一个交易曰中的正常交易时间发生的交易，故在数据中 
总共有5 9 838个时间 间隔. 这些间隔称为交易之间的日持续期.对 IBM 股票，有 
6 531个零时间间隔.也就是说在从1990年11月1日至1991年 I 月3〗曰之间的 
63个交易日的正常交易时间内，每秒钟的多重交易发生了 6531次.大约是10.91%. 
在这些多重交易中，有1 002个有着不同的价格，这大约是全部日交易量的1.67%. 
因此. 多重交易（即苓息持续期）可能会成为交易之间的时间持续期统计模拟中的 
一个问题. 

表 5-2 提供了价格运动的两种分类方式.这里，价格运动被分成“ 上升” 、“不 
变”、“下降 •• 三类，我们将它们分别表示为“ + ”，“0” 和此表给出了样本在两 
个连续交易日内（从第 i -1 个交易日至第 i 交易日）的价格运动.由表中，交易对 
交易的数据 表明： 



?(8(G(4(2(' 


. 0 . 8 . 0 . 4 . 2.0 
In non n 
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表 5-2 

IBM 股票相邻两个日内交易的价格变动的分类 " 


第0 — 1>次交 M 


mi 次众易 


边缘 

+ 

0 


4- 

441 

5 498 

3 948 

9 887 

0 

4 867 

2<) 779 

5 473 

40 119 

— 

4 580 

4 841 

4 10 

9 8.31 

边维 

9 888 

40 118 

9 831 

50 837 


a 价格运动分成-上升”、•‘不变”、“下降”三类.数掂的时叫18:间为年11月丨 丨1 到 19 f ) l 年1 
月31日. 


(1) 连续的价格递增或者递减的情形是相当少的，分别是 441/r.n S37=0.74%, 
410/598 37=0.()9%: 

(2) 从表的第1行看出，有轻微的从“上升”到“不变•’而不是到“下降”的移 
动； 

(3) 价格保持“不变”的倾向 很高； 

(4) 从第3行可以看出，从“下降”到“上升”或者“不变”的概率大致相同. 

前面提到的第一个观测就是买卖报价弹性的一个清楚的说明，显示了日交易数 
据的价格逆转为了确认这个现象，我们考虑价格运动的一个方向序列认.在第/ 
次交易中，对于价格上升、不变、下降三种情况， A 分别取 +1,0. 1三个值. {D,} 

的 ACF 在延迟为1时的取值 0.389 是一个单峰.这对于样本大小为59 837的序 
列来说是高度显著的，从而证实了连续交易中的价格逆转. 

作为第—个解释，我们考虑由 TAQ 数据库得到的 IBM 股票在1999年12月 
的夂易数据.止常的交易时闸是从东部时间早上9: 30至下午4: ()0, 12月31日 
这大除外，因为这天市场在下午 h 00关闭.与 1990-1991 年的数据比较，发生 
了两个重要的变化.首先，日交易次数增加了 6倍，仅在1999年12月就发生了 
134 120次交易.交易强度的增加也给每秒钟的多重交易增加了机会.零时间持续 
期的交易百分比增长了两倍.增长到了 22.98% . 更为极端的是，1999年12月3日 
在给定的一秒钟内发生42次交易的情形出现了两次.其次.价格运动的最小变动 
价位是1/16美元 =0.062 5美元，而不是1/8美元.最小变动价位的变化降低了买 
卖报价差.图 5-3 给出了新样本的日交易次数.图 5-4a 是以秒为单位测齡的交易 
时间持续期的时间图.图 5-4b 是用最小变动价位1/16美元的倍数测景的连续日 
交易的价格变 化图. IK 如所预期的，图 5-3 与阁心知很清楚地说明了円交易次数与 
交易的时间间隔之间的逆转关系.图 5-4h 描述了 \ m ) 年12月3 R IBM 股票的 
两个不寻常的价格 运动： 其一是先下降了 63个价位，紧接着上涨了 G4 个 价位； 其 
二是下降 6S 个价位后，紧接着上涨了 （38 个价位.在一个交易日中，像这样不寻常 
的价格变化是很少发生的. 
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图5~ 3 1洲9年12月 IBM 的交易数据.图屮给出/每个交易日的交易数.其中有的长条加 

丄/标记时间为当天下午 4 : 【) 0以后发生 （ after - hours ) 的交易数 

(») 



» 2() IKK ) 40 OIM ) GO 000 SO IM )0 100 IMMI 12(1 ()00 

序列 


图 5-. 1 19 ⑽年 1‘2月 IBM 的交易数据 .（ a ) 交易之间时间持续期的时间图 （ b ) 以最小变 
动价位 1/ lfi 美元的倍数测贵的连接两个交易的价格变化量的时间图.只包含正常 
交易时间的数据 

对于在正常的交易时刻中记录的交易，在133 475个交易中有61 149个交易 
没有价格变化.这大约是 45 . 8 %，比1"0年11月到1991年1月这个时间段上的 
没有价格变化的交易数少 很多. 看上去是减少最小变动价位增加了价格变化的机 
会. 表 5*3 给出了与价格变化相关的交易数的百分比.价格运动仍然近似地关于0 
对称.日交易中很大的价格变化仍然相对很少. 


表5>3 

人小 

百分比 


与1999年12月交易的 IBM 股票的价格变化相关的日交易百分 比 1 * 



_ ( a ) 上幵运动 _ 

队⑽ _^80_ r/79 _066_025_ 0.15 0.09 0.32 

— ( b ) 下降运动 


百~分& 18.24 5.57 1.79 0.71 0.24 0.17 0.10 0.31 


a 在正常的交易时刻，没有价格变化的交 易的百 分比为 45.8%. 总文 易星为 133 475. 这个人小是以城 
小变动价位1/16美元的倍数测1的. 
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注释：高频教据的保存记录并不像以较低频车抽取的观測值那么好.冈此，在 
高频數据分析中，猙有必要进行數据清理.纣于交易數据.很多方式都可以造成观 
測值的缺失，从而对某些交易而言.精确交易时间的正确程度是值得怀疑的.例如, 
所记录的交易时刻也可能超过东部时间的下午4: 00,甚至超过下一天正常交易时 
间开始之前.怎样处理这些观測值值得仔细研究.数据清理的-个适当方法要求对 
市场操作的方式有很深的理醉.因而，清楚准确地鉴定教掂汝理中使用的方法非常 
重要 •在做 出推断之前，必须考虑这些方法. □ 

另外，令表示从午夜开始以秒力单位测量的笫 i 次交易发生的日历时间，乃, 
表示交易价格.从第/ -丨次交易至第/次交易的价格变化为 yi = AP t) = Pd , 
时间持续期为 AG = U - U — i 这里理解为， 与队 的下标表示交易的时间序列, 
血小是 H 历时阆.在卜面的讨论中，我们主要考虑％与 At , 的单个模型与联合模 
型. 


5.4 价格变化模型 

离散化与集中于“无变化”这两个性质使得我们对日价格变化建模比较闲难. 
Clarnphpn , T , o 和 Markin lay (1997) 讨论了文献中已经提出的儿种计量经济模型.在 
这里，我们提及两种利用解释变量来研究 F 1 交易价格变化的模型.第一个模型是 
Hftuseman ， Lo 和 Mackinlay (1992) 在研究交易数据的价格运动中使用的顺序概率 
值 模型. 第二个模型最近由 McCulloch 和 Tsay (2000) 提出.此模型是 Rydberg 和 
Shephard (2003) 提出的模型的一个简便形式，也可以参考 Ghyseb (2000). 


5.4.1 顺序概率值模型 

令 y ; 表示所研究的资产的不能观测到的价格变化（也就是说 , W = P 彳 
其中 7 Y 表示资产在 f 时刻的真实价格.顺序概率值模型假定乂是一个^续&随 
机变量，服从以下模型 


y * = Xi (3 + £ i , (5.15) 

其中: r , 表示时刻可以得到的解释变量的 p 维行向量,卢是一个 A - x 1参数向 
量， Ehla^) = 0, Var(e<|a; i ) = crj , 并且对于 i / j' ， Cov(£r*,Cj) = 0. 假定条件方差 
^ 是解释变最叫的正函数.即 


aj = g ( wi ), (5.16) 

其中是一个正函数.对于金融交易数据而言,可能包含了时间间隔 
以及某些条件异方差变量.特别地.也可以假定^在给定^和下的条件分布 
是高斯的. 
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假定观测到的价格变化 y , 有 A 个可能的取值，理论上 fc 可以是无穷大，但必 
须是可数的.实际应用中， A : 是有限的.可能涉及将几种类别组合成单个值.例如, 
在表 5-1 中我们有= 7,其中第一个信 “- 3 价位”意味着价格的变化为 -3 个价 
位或者更低，我们将个可能的取信表示为 { Sl .. s 2 ，._. 则顺序概率值模型假 

定 Vi 与 W 之间的关系为 

Vi ~ s ji 若 ^ j—i < y : ‘ a j，j = 1， •. • ， k ， (5.17) 

其中％是实数，满足 —oo — ao < ai < …< cxk-l < a/t = cxj . 在条件高斯分布的 
假定下，我们有 


f*{yi = Sj \ xi , w t ) = P ( otj-i < x t J 3 + fi < 

尸 (a;# 十 q < mjxi ， 叫）， 若 j = 1, 

尸⑷-】 < 0：,/3 + £^ 彡 oijIjTi.ii ;,), 若 j = 2,… ./c- h 

I Plajfc-x < x,P -h £ i \ x i . w t ) 1 若 j = k, 

a \ - x ,/3] 


中 






4 » 


L 〜(叫） 


aj-x - Xj/3 ] 






若 J = 1， 

，若 j = 2, ♦•- , fc - 1, 
若 j = k , 


(5.18) 


其中啊: r ) 是标准正态随机变量的累积分布函数在 i 点的取值.并且我们用 a t ( Wi ) 
表示 of 是 u », 的正函数.从定义中可以看出，顺序概率值模型是由未观测到的连续 
随机变量所驱动的.观测值都有一个自然序号，可以认为是代表所在过程的类别. 

顺序概率值模型包含了参数/3, tt ,(i == 1,... , Ar - 1) 以及方程 （5.16) 中条件方 
差函数 a t ( w ,) 包含的参数.这些参数可以通过最大似然估计或者是 MCMC 方法 
来估计. 

例 5 .1 Hauso 川 a . n , T , o 和 Mackinlay (1卯 2 )对1明8年100多种股票的交易数据 
应用了顺序概率值模型，这里我们仅描述他们对于 IBM 的结果.共有206 794个 
交易.价格变化讲的样本均值（标准差）为 -0.001 0 (0.753), 时间持续期 △«, 的 
样木均值（标准差）为 27.21 (34.13), 买卖报价差的样本均值（标准差）为 1.947 0 
(1.462 5). 买卖报价差是用最小变动价位来测量的.运用的模型对于价格运动有很 
好的分类，而且指定函数为 


= | 乞 礼 + w — „+ 51 札 +4 SP 5 ,_ V + 
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3 



(5.19) 

( rfiw ,) = 1.0 + 7 ?AG + 7| AB /_ i , 

(5.20) 


其中 Tx ( V ) = ( V x - 1)/ A 是指对于 A e [0.1] 的 K 的 Box - Cox 变换.解释变量定 
义如下. 

• = {U - «,- i )/100 是第 i - I 次交易与第 i 次交易之间尺度修正的时间 
持续期，这里时间是以秒为单位测量的. 

• AB ,_! 是时刻流行的以最小变动价位计算的买卖报价差. 

• 1.2,3) 是 <,,,时刻以最小变动价位计算的价格变化的延迟值.对 
于= 9,以最小变动价位计算的价格变化的可能取值为{_ 4 ，3 ， 2 ，I 
0，1，2,3,4}. 

• V,^ v (v = 1,2,3)是第 I : - v 次交易中交易额（美元数）的延迟值.定义为笫 
i - v 次交易的芙元价格乘以交易股份数（股数己经除以 1()(} 了) . B 卩，美元 
数以百为单位. 

• SP 5 i _ v ( w = 1,2,3) 是标准普尔 5 UU 指数.在与第 i - V 次交易发生的月份 
最靠近的那个月到期的期货价格每5分钟连续复合收益率.这里的收益率 
是用（•- 1 , 以前的最近取整时间的前1分钟和前5分钟记录的期货价格来 
计算的. 

• 1,2,3) 是一个示性变量，定义为 

r 1 . 当 Pi-v > (P^ v + J/2, 

= | 0 ,当 Pi_ v = (Pr_ v -f P^ v )/2, 
k _1 ，当 Pi. v < (/f_ n + Pl v )/2, 

其中 P /，0 分别为 G 时刻的卖价与买价. 

表 5-4 给出了参数估计以及它们的比.除了一个比较小以外，其余比 
都很大，这显示了估计是髙度显著的.因为样本的容量很大，所以如此高的 f - 比并 
不令人感到惊奇.对于夂易量很大的 IBM 股票而言，估计结果显示出如下结论. 

(1) 边羿的划分并小是等间隔的，但是关于0几乎是对称的. 

(2) 交易的持续期 △/, 不仅影响方程 (5.19) 表示的//,的条件均值，而且影响 
方程 (5.20) 表示的认的条件方差. 

(3) 延迟价格变化的系数为负并且是高度显著的.显示了价格逆转性质. 

(4) 如所料想的， /. i - i 时刻的买卖报价价差显著地影响条件方差. 
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表 5-4 对 IBM 般票1988年的交易数据，方程 （5.19) 和 （5.20) 中的 
顺序概率值模型的参数估计，其中 t 表示 f - 比 a 


概宇•倌椹助的边界分解 


參数 


Ck 2 


cm 

Q 5 

Q 6 

OC 7 

ctg 

估计 

-4.67 

-4.16 

-3.11 

-1.34 

1.33 

3.13 

4.21 

4.73 

t 

-145.7 

-157.8 

-171 .G 

-155.5 

154.9 

167.8 

152.2 

138.9 

概年 饱模型的方朽!参数 

参数 

71 

ya 

- A /； 

•hi 


04 

06 


估计 

0.40 

0.52 

-0.12 

-1.01 

-0.53 

-0.21 

1.12 

-0.26 

t 

15.6 

71.1 

-11.4 

一 135.6 

-85.0 

-47.2 

54.2 

-12.1 

参数 

Pt 


fh •• 

010 

Pu 

012 

/?13 


估计 

0.01 

一 1.14 

-0.37 

- U .17 

0.12 

0.05 

0.02 


t 

0.26 

-63.6 

-21.6 

-10.3 

47.4 

18.6 

7.7 



a 已妗被 EWvicr 授权 M 印. 


5.4.2 分解模型 

刈价格变化建模的另外一个力法是将价格变化分解为3个组成部分 t 然后运 
用每一部分的条件确定.具体句参见 Rydberg 和 Shephard (2003) .这3个部分分 
别为价格变化的示性量、有价格变化时价格变化的方向以及价格变化发生时变化 
的 大小. 具体来讲，在第 i 次交易中的价格变化可以写为 

Vi = Pti — Pt % - X = AiDiSi, 

其中次是一个二元变量.定义为 

f 1，如果第 i 次交易中有价格变化， 

' \ 0，如果第 i 次交易中无价格变化. 

也是一个离散变量，它表示有价格变化的时候.价格变化的方向，即 

1 -1, 第 i 次交易中价格下降， 

其中= 1) 息思是说 A 是在 A = 1的条件下定义的.当第 i 次交易中有价 
格变化&指最小变动价位的 大小； 当第 i 次交易中没有价格变化时.氏=0.当 
有价格变化时 • &是一个止的实值随机变 M . 

注意到次= 0时，不需要£>,，并且在分解中有一个自然的次序.只有当 A = 1 
时， D , 才有 定义； 只有当 A , = 1并且给定 A 的条件下，&才有意义.分解中模型 
的确定利用了这个次序. 


(5.21) 


(5.22) 


(5.23) 



S’, 1 ( A, 4 = l) 〜 1 + 


其中 »( A ) 是参数 A 的几何分布，并且参数 Ap 随时间的变化为 

111 (l +%,) =Wi0 3 或入 ：M = 工 + c w t 0 } ， ^ = U ' d ， ( 5 . 28 ) 

其中 tu , 指中有限维的解释殳量 ： ~是一个参数向量. 

在方程 （5.27) 中，随机变量 z 服从几何分布 5 ( A ), 其概率质量函数为 

p(x = m ) = A (1 — A ) m , m = 0,1,2, ••- . 

我们在几何分布中加了 l , 以便当发生价格变化的时候，价格的变化至少为一个最 
小变动价位.在方程 （5.28) 中，为了确保 Ay e [0,1], 我们作了 logistic 变换 • 

前面的具体化将第 i 次交易分为 三类 . 

(1) 无价格 变化 ： A = 0而且相应的概率为 (1 - Pi )- 

(2) 价格 上升 ： A = 1, Vi = 1,相应的概率为 p ,6 i . 价格上升的大小是由 
1+ U 控制的. 

(3) 价格 下降 ： A = 1, A = -1, 相应的概率为 p ,( l -^). 价格下降的大小是 
由控制的. 
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令6表示第 i 次交易中可以得到的信息集合 . K 的元素为 AU - J , A t ^, Di . 3 
以及^ 0). (5.21) 的模型下，价格变化的演变可以分解为 

P ( y i | F i _ 1 ) = P ( A l A 5 i | F i _ l ) 

= P(5 l |AMi,F i _ l )P(D,|^,F i _ 1 )P(A £ |F i _ l ) (5.24) 

因为皋是一个二元变量，所以只要考虑随时间演变的概率 p , = P ( A , = 1) 就足够 
了.我们假定 ^ 

In (— ^—或 Pi = h ' (5.25) 

\1 - Pi J 1 十 e 1 *^ 

其中 A 是一个包含了 中的所有元素的有限维向量 ， 月是一个参数 向量. 在 
八=1的条件下， D , 也是一个二元变量，对 A = P{Di = l\Ai = 1), 我们利用下面 
的模型 z 

ln ( I^)= 2 A 或 Si ^ TT ^' (526) 

其中 A 是一个包含了 中的所有元素的有限维向置, 7是一个参数向量.为了 

允许正负价格变化之间的对称性，我们假定 


Q£) 

果果 

如如 


ti.’ dl 

A A 

/—\ /(\ 
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对于 ./ = 1,2,3,令 A ( j ) 表示前面三类的示性变量，也就是说，当第 j 类发生 
时， Ji ( j ) = 1，当第 j 类不发生时，乃⑴= 0.方程 (5.24) 的对数似然函数为 

ln[P(t/<|Fi_i)] = /i(l)In[(l -p t )] + /i(2)[ln(pi) + ln(tfi) 

+ ln(A u ， t ) + (5* - 1) ln(l — A u .i)] 

+ 八⑶知 ⑺,） + l n (l - <5 ‘） + In(+ ( 氏 一 1) In(l - 

并且全部的对数似然函数为 


ln[P(ja ， ... ，如 |Fo)j = ^\n[P(yi\Fi-i)], ( 5 . 29 ) 


这是参数 /3, 7 , 以及心 的一个函数. 

例 5.2 我们通过解释 IBM 股票从 1990 年 11 月 1 日至 1991 年 1 月 31 日的日 
交易来说明分解模型.共有⑽个交易日，在正常的交易时间内发生了 59 838 次曰 
内交易.运用的解释变量如下. 

0) 儿上一次交易的行动示性变量（也即在一个交易日内的第 i - l 次交 

易). 

(2) Di _ is 上一次交易的方向示性变量. 

(3) Si - l： 上一次交易的大小. 

(4) V t - i ： 上一次交易的成交量除以 1000. 

(5) A ^_ 1： 从第 i 一 2 次交易到第 i - 1 次交易的时间持续期. 

(6) BA r . 交易时刻的买卖报价价差. 

囚力我们利用的是延迟为 1 的解释变量.所以实际的样本大小为 59 775. 对十所试 
用的模型与 J 34, 都不是统计显著的，从而我们只运用了前三个解释变 
量.采用的模型为 

lu ( r ?^) = A )- t -/3 iA i _ l , 

111 ( r ^~) =70 + 7 iA - i , (5.30) 

ln GU = ° n '° " wh ， 

In = ^,0 + ^.iSi-t. 

利用方程 (5.29) 中的对数似然函数得到的参数估计在表 5-5 中给出.估计得到的简 
单模型显示了价格变化中的某些动态依赖件.尤其是， TRM 股票的交易对交易的价 
格变化呈现出许多如下吸引人的性质. 
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表 5-5 方程 （5.30) 中对 IBM 从1990年11月1日到1991年1月31日的日内交易 
ADS 模型的参数估计 


标准差 



-1.057 0.962 -0.067 -2.307 2.235 -0.670 2.085 -0.509 

0.104 0.044 0.023 0.056 0.029 0.050 0.187 0.139 


(1) 价格变化的概率依赖子上一次的价格变化.具体地.我们有 

P{Ai = =0) = 0.258, P { A t = 1|4卜 j = 1) = 0.476. 

这个结果显示价格变化的发生是聚类的.正如所料想的，大部分交 M 没有价格变化. 
当在第 i - 1次交易中没有价格变化时.则在随后的交易中，只有人约1/4的交易 
有价格变化；当在第/ - I 次交易中有价格变化时，在第*次交易中.价格发生变化 
的概牟增加为大约 0.5. 

(2) 价格变化的方向由下式控制 

1 0.483, 如果 Di 1=0(即>4< , = 0), 

0.085, 如果 A-i 

0.904, 如果 £) t _i =-1,^ = 1. 

这个结果说明 

①如果第/ 一 1次交易中没有价格变化，那么在第/次交易中价格上升和 
下降的机会是平 等的； 

②连续的价格上升或者价格下降的概率非常低.给定第 ；-1 中交易上升 
而且第/次交易中价格发生变化的条件下，第；次交易的价格上升的概 
率仅仅只有8.6% . 然而.在给定第 i - 1次交易中下降而且第；次交易 
中价格发生变化的条件下，第 i 次交易的价格上升的概率大约为90% . 
闵此，这个结果显示了买卖报价弹性的影响，支持了高频数据交易中的 
价格逆转. 

(3) 只有很弱的证据表明大的价格变化有更大的可能性跟随另外一个大的价格 
变化，考虑价格增长的大小，我们有 

Si\(Di = 1) 〜1 + g(\ Uti ), X u ,i = 2.235 - 0.6705, 

利用几何分布的概率质量函数.我们得到如果交易导致一个价格增长而且= 1, 
那么在第 i 次交易中.价格增长一个最小变动价位的概率为【).827.当 5 t _j =2 R * J , 
此概率下降到 0.709, 当 Si _! = 3时下降到 0.55 G . 因此，给定第/次交易屮价格增 
长的条件下， 一个大 Si 的概牟与成反比. 

ADS 模型与顺序概牟值模型的一个区 别是： ADS 模型并不要求价格变化大小 
中的任何截断或者分组. 
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5.5 持续期模型 


持续期模型主要考虑交易之间的时间间隔.较长的持续期预示着较少的交易活 
动，这反过来又表明了一个没有新消息的时期.这样，持续期的动态行为就包含了 
关于日内市场活动的有用信息.利用类似于波动率的 ARCH 模型的概念， Engle 和 
RuHseU (1998) 提出了自回归条件持续期 ( ACD ) 模型来描述股票（尤其是大量交易 
的）时间持续期的 演变 . Zhaug , Russell 和 Tsay (2001 a ) 扩展了 ACD 模型来解释 
数据中的非线性性与结构突变.本节引进了一些简单的持续期模型.正如前面提到 
的，日内交易展示了一些日模式.因此，我们集中讨论调整的时间持续期 




(5.31) 


其中 f ( t t ) 是一个确定的函数，有△〖,的循环成分组成.显然 f ( U ) 依赖于标的资产 
(underlying asset ) 以及市场的系统行为.实际应用中，有很多估计 f ( t t ) 的方法.但 
是根据统计件质没有一种方法总是优干其他方法的光滑插值是一个通常的方法， 
这里我们运用简单的次插值函数与示性变量来处理 日交易 活动中确定的组成部 
分- 

对于用来解释 ADS 模型所采用的 IBM 股票数据，我们假定 


其中 


/(*i)= exp[d(<i)]. d{ti) - 00 + ⑹， 


(5.32) 


MU) = - 

h{U ) =- 


-43 200 、 2 

V 14 400 J ， 

(U -48 300 \ 2 

V ~9 300~~ ) ' 



f -(^ 

- 38 700 \ 2 

若 





Mu ) = < 

7 5 UU ) ' 

U 

< 

43 

200. 


o, 

V 


若 

U 


43 

200, 



- 48 600 \ 2 

若 





U(U) = < 

9 000 ) 1 

ti 


43 

2 UU , 


0, 

V. 


若 

ti 

< 

43 

200. 


/5( G ) 与 W ，) 是市场开盘时第一个 5 分钟与第二个 5 分钟的示性变量.[即 /,(.) - 
1当目.仅当在东部时间的上午9: 3 0至上午9: 35之间 1. f T ( ti ) 指日交易的最后 
30分钟的示性值.[即 f 7 ( ti ) = 1当且仅当交易发生在东部时问下午3: 30至 f •午 
4: 00】.图 5-5 给出了对于1，2,3,4, /“•) 的图形，其中 * 轴的时间刻度是分钟. 
注意到/ 3 (43 200) - / 4 (43 200), 其中43 200对应于中午12点. 

方程 (5.32) 中的系数爲可以通过线性回归的最小二乘法得到 


7 

ln(A/.,) - /i a 4- ^2 办 /j ⑹ + e *. 
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(a) (c) 



0 1( H ) 200 300 4( H ) 0 100 2 lMt 300 4( H ) 

分钟 分钟 


m 5-5 用来消除 IBM 闩内交易持续期的确定成分的二次 函数： 
( a )—( d ) 分别是方程 (5.32) 中的 /“.） 到 /,(■) 

拟合的模型为 

In(A^) = 2.555 十 0.159 /刺 + 0.270/2(0) 十 0.384/ 3 (t<) 

+ O.O 6 I/ 4 (fi) - 0.611/s ⑹一 0.157/6 ⑹ + 0.073/ 7 ( 幻 ). 


图 5~6 给出了 63 个交易日中每 5 分钟时间间隔的平均持续期的时间图，包括 
对于确定性部分调整前以及调整后的图形.图 5-6 a 为 △/, 的平均持续期，正如我 
们所料想的，它展示了一个每日模式.图 5-6b 为 AQ 的平均持续期 （也就 是调整 
延迟的时间持续期)，每日模式大大地消减了. 



0 10 20 30 40130 607()80 0 1020 304050 G 0 7080 

5分钟的区问 &分钟的区间 

[ f ] 5-6 IBM 从1990年11月1日到1091年1月31日的交易数据 ： （ a ) 每 5 分钟时问 
N 隔的平均持续期 . ： b ) 对确定成分调整之后的每 5 分钟的平均持续期 











5.5.1 ACD 模型 
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白回归条件持续期 ( ACD ) 模型利用 GAHCH 模型的思想来研宄方程 （5.31) 中 
调整的时间持续期的动态结构.为了记号的简便.我们定义 a ：, = At ；. 

令叭=表示第 z - 1次交易至第次交易的调整的时间持续期的 
条件期望.其中 Fi , 为第 i - 1次交易时町以得到的信息集合.换句话说，也为给 
定 F ,_! 的条件卜期望的调整持续期.基本的 ACD 模型定义为 

X , = (5.33) 

其中{^}是独立同分布的非负随机变量序列满足 E (£.) = 1.在 Engle 和 Russell 
(1998) 中， q 服从一个标准指数分布或者是标准化的韦布尔 （ Weibuli ) 分布，并且 
也假定为以下形式 

r a 

tAi = t ^十 〉: 十 》二 • (5*34) 

i=l ，•一 1 

这样一个模型可以称为 ACD ( r , s ) 模型.当 q 服从一个标准指数分布时，结果中的 
模型称为 EACD ( r ,.?) 模型类似地，如果服从标准化的韦布尔 （ Wdbull ) 分布， 
则称为 WACD ( r .«) 模型.有必要的话，读者可以参考附录 A . 对指数分布与韦布尔 
分布进行一个一个快速的回顾. 

与 GARCII 模型类似，过程屮 =了、-机 是一个鞅差序列 [BP b ：( r / t | f ；_ 1 ) = 0], 
ACD 模型可以写为 

max(r,a) s 

Xi = uj + ^2 (7 j + u ) j ) Xi-j — UjVi-j + ” j ， (5.35) 

j=i 

这正好是没有高斯新息的 ARMA 过程的形式.此处，对于 j > r ， ％ = (); 对于 
J > s } Uj = 0. 可以用这样的表示来得到 ACD 模型弱平稳性的基本条件.例如，对 
方程 (5.35) 两边取期望，并且假定弱平稳性，则我们有 


因为期望持续期是正数.所以我们假定 U ； > 0, 1 > E ( 7j + %).作为方程 （5.35) 的 
另外一个应用，我们研究一下 EACD (1，1) 模型的性 
EACD(1 ， 1 ) 模型 
—个 EACD (1,1) 模型可以写为 

Xi = '0» = w 十 71 ^*-1 十 1 ， (5.36) 

其中服从标准指数分布.利用附录 A 中标准化指数分布的矩，我们有 
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E ⑹ =1 ， Var(£i) = 1, E(e?) = Var^j) -f [E(ei)] 2 = 2. 

假定是弱平稳的（也就是说 •/:, 的头两阶矩不随时间变化)，那么我们可以导出 
X ,的方差.首先对方程 (5.36) 两端取期望，我们有 


E(x<) = E[E(-0i£-,|Fi_i)] =E( 叭)， E(V>,) = w + 7 iE(xj_i) +wiE(^j_i). (5.37) 

在弱平稳性的条件下， E ( 也） = E ( V » i -0, 因此方程 (5.37) 给出 

t^x = E(ij) = E(^j) = - : • (5.38) 

1 — *7i — u\ 

又因为 E (#) = 2, 我们有 

E(x?) = = 2E ( 也 2 ). 


在方程 (5.36) 中对也的 T 方取期望，并且利用也和工，的弱平稳性质，通过某些 


代数运算.得到 


E (0 i ) = /4 x 


1 一 （7 i + wi ) 2 
i 一 27 ? — lj i — 271LJ1 


(5.39) 


最后，利用 Var^) - E(x?) - [E ⑷)] 2 , E(a;?) = 2E(0?). 我们有 


Var(a：,) = 2E(t^?) ^ ^ 


1 — uij — 27^1 
1 — u/f - 27iLl>i - 2 ^ 


其中心 如方程 (5.38) 中定 义. 这个结果显示，为了得到时间不变的无条件方差，方 
程 (5.36) 中的 EACD(1,1) 模型必须满足 1 > 2 7 ?H-u;?+27iu; 1 . WACD(l.l) 模型 
的方差可以利用同样的方法以及标准化韦布尔分布的前两阶矩得到. 

带有广义伽玛分布的 ACD 模型 

在统计文献中，强度函数经常根据危险率函数来表示.正如附录 B 中所示, 
EACD 模型的危险率函数随时间不变.而 WACD 模型的危险率函数是一个单调函 
数.这些危险率函数在实际应用中相当受限制， W 为股票交易的强度函数可能不固 
定，或者不随时间单调变化.为了增加相应的危险率函数的灵活性， Zhaug, Russell 
和 Tsay (2(K)1) 对& 采用了一个 （标准化的） 广义伽玛分布.对于广义伽玛分布的 
基本性质可以参见附录 A . 结果中的危险率函数可以假定不同的模式.包括 U 型或 
者倒转的 U 型.我们将新息服从广义伽玛分布的 ACD 模型称为 GACD(r, a ) 模型. 


5.5.2 模拟 

为了说明 ACD 过程.我们利用的两种不同的新息分布，从 ACD(U) 模型 


x t = t/>i = 0.3 + 0.2x t _i + 0.7ip t -i 


(5.40) 
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m 5-8 


中产生了 50() 个观测值.在第一种情形中，假定£，服从参数 o = 1.5 的标准化的韦 
布尔分布：在第二种情形中，假定&服从参数 K = 1.5, u = 0.5 的一个(标准化的) 
广义伽玛分布. 

图 5~7 a 给出了 WACD (1 ; 1) 序列的时间图，图 5-8 ti 为 GACD (1,1) 序列的时间 
图.图 5-9 描绘出/两个模拟序列的直方图.两个模型的区别是很显然的.最后，在 
图 5-10 a 与阁 5 -llb 中，我们分别给出了两个模拟序列的样本 ACF , 从中可以清楚 
地看到序列的相依性. 


1 U 
琢 S 

n - 0 

龙‘1 
2 
U 


( a ) 模拟的 \ VACD <1, U 序列 



时间指数 
do 紅准化的残差 



II 100 2(X1 30() 400 5IH) 

时间指数 


由 (5.40) 式模拟的 WACD ( U ) 序列： （ a ) 原始序列: 
( h ) 估计后的标准化序列.共有500个观测值 



n 10(1 200 300 400 5011 

时问指数 


(10 标准化的残若 



由 (5.40) 式模拟的 (； ACD (1,1) 序列 ： （ a ) 原始 序列: 
( b ) 估计后的标准化序列.共有 50(1 个观测倌 


2r,21)lr)l(l 5 (l 

fatsifeik 龙 


2 






5 - 

阁 


8()Gll4<) 

00^ 
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图 5-9 



具有500个观测侑的模拟的持续期过稈的宵方阁： （ a ) WACD ( l . l ) 模型; 
( b ) GACD ( U ) 綱 



(») 原始序列 



间颶 


0.) 标准化的残差序列 


o 



图 5-10 具有500个观测值的模拟 WACD (1,1) 序列的样本自相关函数： （ a ) 原始 序列; 
( b ) 标准化残差序列 

5.5.3 估计 


对子 ACD ( r , a ) 模型，令 t:u = max ( r , a ), = ( a：i , , x t )'. 持续期 a ： i , X2 , ••- , x T 

的似然函数为 

* r • 

f(xr\0) = II xf{x iu \e), 

ji=io+l . 

其中 0 表示模型的参数向量， r 表示样本大小.前一个方程中的边缘概率密度函 
数 f ( x io \0 ) 对广义的 ACD 模型而言相当复杂.因为它对似然函数的冲击是随着 
样本 大小了 的增加而递减的，边缘密度通常忽略了这一点，从而导致了条件似然方 



















5.5 持续期模型 203 


( n ) 原始序列 

0.5 

U . ().3 
U 

< 0.1 
- 0.1 

_ 

( I .)标准化的残差序列 
0.5 

U , 0 3 

O 

< 0.1 
一0,1 

0 5 10 115 20 25 30 

间隖 

m 5-11 具有500个观测值的模拟 GACTD ( l . l ) 序列的样本自相关函数： （ a ) 原始 序列； 

( b ) 标准化残羞序列 

法的运用.对于 WACD 模型，我们利用方程 (5.55) 中的概率密度函数 (probability 
density function , 简记为 pdf ) 得到条件对数似然函数为 




T * r r 、 n y 

l(x\0.x ia )= ^2 aln r ( 1 + S) +hi ( 彔 ) 

t=» 0 +l L \ / J 、 ' ’ 


(5.41) 


其中也 =a ； + X] + ujjijti-j, 0 = ， 7 r ， wi ， ... ， t^,rv)’，rr = 

(〜^•，…，打广 % a = (条件）对数似然函数简化为 EACD ( r , s ) 模型的 

形式. 

对于一个 GACD ( r , s ) 模型，条件对数似然函数为 


^ ln ( ) 1 (« a l)l»(a ： t) ln(AV>t) 


,(5.42) 


其中 a = r(«)/r (« + ；；)' 参数向量 0 也包含如我们料想的，当 k = 1 , 

A = 1/ r^l 十时.方程 (5.42) 中的对数似然函数简化为方程 (5.41) 中模型 

WACD ( r ,«) 的&然函数形式.这个对数似然函数可以改写为许多形式来简化估计. 

在某些正规性条件下，条件最大似然估计是渐近正态的，具体可参见 Engle 和 
Russell (1998) 及其参考文献.在实践中，一旦指定了持续期模型.对于感兴趣的问 
题可以用模拟的方法得到有限样本的参考分布. 

例 5.3( 模拟的 ACD (1,1) 序列的继续）考虑方程 (5.40) 中模拟的 WACD (1,1) 序 
列以及 GACD (1，1) 序列，利用条件似然方法得到的结果列于表5^6中，估计看上去 
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是合理的 .令也 表示‘0，的丨步向前预测，= Xi / tj } i 为标准化的序列.可以认为 
是序列标准化的残差.如果模型已充分确定， { fj 应该以独立同分布随机变暈的形 
式运动•图 5-7b 与图 r>-8b 显示了两个模型匕的时间图.拟合的两个模型的心的 
ACF 分别在图 5-l()h 与图 5-lib 中给出.很显然在序列中没有发现显著的序列 
相关. 

表 5-6 对模拟的 ACD (1，1) 模型的500个观测值序列的估计 结果： 

( a ) WACD (1,1) 序列； （ L ») GACD (1,1) 序列 


VVACU(1 ,]) 模型 


#数 

U) 

71 

叫 

U 


真实值 

0.3 

0.2 

0 7 

1.5 


估计值 

0.364 

0.100 

0.767 

1.477 


标推误差 

(0.139) 

(0.025) 

(0.060) 

(0.052) 


GACD ( U ) 模型 

参教 

OJ 

71 


a 

K 

真实值 

0.3 

0.2 

0.7 

n .5 

1.5 

估计值 

0.401 


0.561 

0.436 

2.077 

标准误筹 

(0.117) 

(0.074) 

(0.065) 

(0.078) 

(0.653) 


例 5 . 4 作为持续期模型的说明，我们考虑 IBM 股票从 199() 年11月1日至19!)0 
年11月7日连续5个交易日内的交易间的持续期.集中于正的交易持续期，我们 
共有3 53 4 个观测值.另外,将数据作了调整，消除了方程 (5.32) 中的确定成分.也 
就是说.我们采用 r 方程 (5.31) 中定义的3 534个正的调整持续期. 

图 5-12 a 给出了 1900年 1] 月的前5个交易曰内调整的 （ IH 的）持续期，阁 
5-13 a 给出了序列的样本 ACF . 在调整的持续期中.还存在一些序列相关性.我们 
对数据拟合一个 WACD ( U ) 樽型.得到的模型为 

A = 咖 = ()• 16(J + 0.064^_, + 0.885-0,-1, (5.43) 


序列 

W 5-12 在1990年11月的前5个交易 U 交易的 IBM 股票持续期的时间图：⑷调整的 
序列； （b) WACD(1,1) 模型的标准化新息.其屮有3 534个非岑的持续期数据 












.5 持续期模型 205 



_ 

(1»标准的新息序列 

0.20 --- 

(U0- 



- O . U » 4,_,_,_,_ | 

0 1 () 20 30 

间明 

阁 5*13 在1990年11月的钳5个交易口交易的 IBM 股票调粮持续期的样本自相关 函数： 
(a) 调整的序列 ： （ b ) WACD ( l . l ) 模型的标准化新息 

其中 {£,} 是一个独立同分布的随机变量序列，服从参数 （i = 0.879(0.012) 的标准 
化的韦布尔分布，这里 0.012 为估计的标准差.方程 (5.43) 中估计的标准差分别为 
0.039, 0.0 K ) 和 0.018. 所有估计的比都大于4.2,说明估计在1%水平下是显著 
的.图 5-12 b 给出了心= x '/ i 、 的时间图，图 5-131) 提供了 6的样本 ACF . 6的 
Ljung - Box 统计量为 Q (10) = 4.96, Q (20) = 10.75. 显然，标准化的新息没有显著 
的序列相关性.事实上，平方序列{疗}的样本自相关性也很小，其 Q (10) = G .20, 
Q (20) = 11.1(5, 进一步确认了标准化的新息之间缺少序列相依性.另外，参数为 
= 0.879 的标准化的韦布尔分布的均值和标准差分别为 1.()0 和 1.14, 这些数字也 
接近于 R ,} 的样本均值 1.01 和标准差 1.22. 拟合的模型看上去是合适的. 

在模型 （5.43) 中，估计系数 T + U ；! « 0.949. 隐含了调辖持续期的某种持续性. 
调整持续期的期望为 0.169/(1-0.004 0.885)=3 31 这接近于调整持续期的样本 

均值 3.29. 标准化韦布尔分布的形状参数的估计 o 为 0.879, 小于1但是接近于 1. 
因此，条件危险率函数以缓慢的速率单调递减. 

如果对新息采用广义 gamma 分布函数，那么拟合的 GACD (1，1) 模型为 

x, = 灿也 = 0.141 4 - + 0.897V>»_i, (5.44) 

其中服从方程 (5.56) 的标准化的广义伽玛分布，参数 K = 4.248(1.046) 且参数 
a = 0.395(0.053), 括号内的数字表示估计的标准误差.方程 (5.44) 中三个参数的标 
准误差分别为 0.041. 0.010 和 0.019. 所有的估计在1%水平卜都是统计上显著的. 
标准化的新息过程 { f ,} 及其平方序列都没有显著的序列相关.这里= x ,- M 是根 
据模型 (5.44) 定义的.具体来讲.对于心过程.我们有 Q (10) = 4.95, Q (20) = 10.28; 
对 € 序列，我们有 Q (10) = 6.36, Q (20) = 10.89. 
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模型 (5.44) 的期望持续期是 3.52. 稍高于方程 （5.43) 中 WACD (1,1) 模型的持 
续期.类似地，模型 (5.44) 中的持续参数七十仏也稍髙于 0.96. 

注释： EACD 模型的估计可以利用一些带 minor 修改的 ARCH 模型的程序 
来 实现. 具体可参见 Eugle 和 Russell (1998). 本书用作者创建的 RATS 程序或者 
一些 Fortran 程序来估计持续期模型.有限的经验表明估计一个 CIACD 模型比估 
计一个 EACD 模型和 WACD 模型都更困难.用来估计 WAC’D 与 GACD 模型的 
RATS 程序在附录 C 中给出. 口 

5.6 非线性持续期模型 

高频数据中也通常会发现非线性性质.作为说明，我们在例 5.4 中，对 TT 3 M 交 
易的持续期拟合的 WACD (1,1) 模型的标准化新息.利用第4章中讨论的些非线 
性检验，可参见方程 (5.43). 根据一个 AR (4) 模型，在表 5-7 中的⑷部分给出检 
验结果 • 正如从例5- 4 的模型诊断中预期的， Ori - F 检验显示标准化新息中没有二 
次非线性性.然而， TAR - F 检验统计 M 却显示了很强的非线性性. 


表 5-7 对 1 RM 从1"0年11月1日至1990年11月7日交易持续期的非线性检验 a 


类型 

Ori-F 

TAR-F(l) 

TAR F(2) 

TAR-F(3) 

TAR-F(4) 

(a) WACD(1,1) 模型的 iH 态化新息 

检验 

0.343 

3.288 

3.142 

3.128 

0.297 

P 值 

0.969 

0.0D6 

0,008 

0.008 

0.915 

(b} N 限 WACD(l.l) 模型的正态化新息 

检验 

0.163 

0.T4G 

1.899 

1.752 

0.270 

P 倌 

0.998 

0.5K9 

0 091 

0.119 

0.929 


a 只利用了 FI 内持续期 TAR-F 检验括号内的数表示吋问延迟. 


根据表 5-7 的检验结果，我们对 IBM 的日内持续期考虑一个两体制的门限持 
续期模型 (threshold duration model ). 门限变量为： rt - UB 卩一步延迟调整持续期). 
门限值的估计为 3.70. 拟合的门限 WACD (1,1) 模型是 - rp i£u 其中 

_ I 0.020 + 0.25Tj： f _i + 0.847^_!,£：* u;(0.901), 若 Xi -x ^ 3.79, r ^ 

\ 1-808 -f 0.027x«-x -h 0.501 咖一 i，g 〜切 (0.845 )，若 Xi^ > 3.79, 

这里 w { a ) 表示参数为 《 的标准化韦布尔分布.两种体制下观测值的数量分别为 
2 5() 3和1 0；30.在方程（5. 4 5) 屮， 第一个体制中参数的标准误差分别为 0.043. 0.041, 
0.024 和 U .014; 而第一个体制中参数的标准差分别为 ().526, 0.020, 0.147 和 0.020. 

考虑方程 (5.45) 表示的门限 WACD ( l . l ) 模型的标准化新息& = 得到 

6的 Q (12) = 9_8, Q (24) = 23.9; # 的 Q (12) = 8.0, Q (24) = 16.7. 这样，心序列与 
i ' i 序列之间均无显著的序列相 关性. 而且.对这个新的标准化新息序列应用前 
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面同样的非线性检验，我们没有检验出非线性，结果见表 5-7( b ) 部分.因此，方程 
(5.45) 中的两体制 WACD (1,1) 模型是合适的. 

如果我们将两体制分为大童交易与很少交易两个时期.那么对 IBM 股票.门 
限模型显示.由日内交易持续期度量的交易动态性在大量交易与很少交易两个时期 
是不同的（即使在日内模式调整之后).这并不令人惊奇.因为市场活动经常是新的 
信息和其他信息的到达驱动的. 

方稈 (5.45) 估计出的门限 WACD ( l . l ) 模型包含一些不显著的参数.我们将模 
型提炼得到如下结果 

f ().225zi_：L + 0.867 也 —i ， e, 〜 w(0.902 )， 若 x t _i ^ 3.79, 

l/’i ^ 

' 1.618 + 0.614^i_i,£i ~ w(0.846), 若 Xi~i > 3.79. 

提炼出的模型的参数估汁都是髙度显著的.标准化的新息的 L - B 统计 
愿.显示 Q(10) = 5.91(0.82). Q(20) = 16.04(0.71); # 的 L-B 统计量显不 Q(10) = 
5.35(0.87), QC2U) = 15.20(0 7«), 这里括号内的数字是 p 值.因此.提炼出的模型是 
合适的.用来估计前述模型的 KATS 程序在附录 C’ 中给出. 

5.7 价格变化和持续期的二元模型 


本节引入一个 考虑/ •价格变化和相应持续期的联合过程的模型.如前所述，许 
多股票的日内交易是无价格变化的、那些交易与交易强度高度相关，但它们不包含 
关于价格运动的直接信息.因此，为了简化价格变化建模中的复杂性，我们集中讨 
论导致价格变化的交易.并考虑同时描述价格变化和相应时间持续期的多元动态性 
的价格变化与持续期 (price change and duration . 简称为 PCD ) 模型. 

继续利用 5.6 节中记号.但是定义改为价格变化的交易.令 t , 是资产在第 i 次 
价格变化的日历时间.同前面一样,^是从一个交易日的午夜开始以秒为单位测量 
的. 令忾. 表示第 i 次价格发生变化时的交易价格.^ 是价格变化的 

时间持续期.另外.令况表示时间间隔中无价格变化时的交易数量.这 
个新变量被用来表示无价格变化期间的交易强度最后，令 A 表示第/次价格变 
化的方向-当价格上升时， Z ), = 1;当价格下降时 ， A = -1 .令忒 表示以最小价位 
变动申位测量的第；次变化的大小.在新的定义下.股票价格随时间的变化为 

Pt t = Ptt-t + DiSi . (5.46) 

对第/ 次价格变化的夂易数据包括 { A / 1: H %}. PCD 模型关心的是对 
Di . Si ) 的联合分析. 

注释： 集中于与价格变化相联系的交易可以大大地降低样本的大小.例如.考 
虑 IBM 股票从 1990 年 11 月 1 日至 1991 年 1 月 31 日的日内數据，共有 60 265 
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个曰内交易，但是它们中只有 19 022 个引起了价格 变化. 另外，价格变化的时间持 
续期中没有日内模式. 口 

为了解释所有交易的价格运动与只跟价格变化相关的交易的价格运动之间的 
关系，我们考虑 IBM 股票在1990年11月21曰的曰内交易.在这一天的正常交易 
时间•有726个交易.只有 1 M 个交易引起了价格变化图 5-14 显示了两种情况下 
价格序列的时间阁.正如所预期的价格序列是相同的. 


( a ) 所有交秘 




图 5-14 IBM 股票在1990年11月21 EJ 的闩内交易价格的时 间图： 

( a ) 所有交易： （ b ) 导致价格变化的交易 

在给定 i 的条件下， PCD 模型将 ( At ^ N ^ D ^ Si ) 的联合分布分解为 

= /(5i|A, Ni, AU, Ati, (5.47) 

这个分解使得我们能够对条件分布指定合适的经济计量模型.从而简化建模的任 
务.有许多方式对条件分布指定模型.一个恰当的指定可能依赖于所研究的资产. 
这里我们采用 McCulloch 和 Tsay (2000) 使用的指定.他们对离散取值的变量采用 
广义的线性模型，对连续取值的变量 ln ( AA t ) 采用了一个时间序列模型. 

对价格变化之间的时间持续期.我们采用的模型为 

= A ) + /?i ln ( A « i _ i ) +/?25<_1 +< re ,, (5.48) 

其中 n 是正数， {&} 是独立同 分介. 服从 N (0,1) 的随机变量序列.这是关于延迟变 
黾的多元线性回归模型.如果有必要，可以在模型中加入其他的解释变量.为了确 
保时间持续期为止.我们利用 f 对数变换. 

队 的条件模型又被进一步分解为两部分.因为经验数据显示 yv , 集中在0点. 






N t 模型的第一部分为 logit 模型 
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= 0| A / t , F ,_ i ) = logit[«o + «1 ln ( A / j )], 


其中 log = exp ( x )/ fl 十 exp (. r )], 而模型的笫二部分为 




exp [ 7o - f 7 i ln ( A /, j )] 

1 十 exp [ 7o + 7 ! ln ( A ,,)] ’ 


其中〜意思是“服从的分布为”， g (\) 表示参数为 A 的几何分布，即 A 在区间 
上取值. 

方向 A 的模型为 


(5.49) 


(5.50) 

( 0 , 1 ) 


DiKNi, At it F, t) =s\gn(fXi +a,£), (5.51) 

其中 e 为服从 N ( Q , 1) 的随机变量，而且 

/i, = u；o -fo ； iDa_i -f uj 2 ln(A/,), 

4 

In(o - , ) = fi 〉: D% —j = I -1 + 2 + ■Oi—a + Dt—4 1 • 

换句话说，认是由均值为方差为 < 的正态随机变量控制的.上述模型的特殊 
特征是函数 in ( a t ). 对于日内交易.一个关键的性质是两个连续价格变化之间的价 
格逆转.这个性质是通过在均值方程中对 Di . x 的依赖允许^为负值来建模 
的.然而，价格运动中存在很少的局部趋势.当过去的数据呈现出局部趋势时，上 
述的方差方程通过增加价格运动方向的不确定性来允许这样的局部趋势存在于模 
型中.对于一个有固定均值的正态分布，增加方差使得一个随机移动有同样的机会 
取正值或负值.这又增加了序列仝部为正的移动与全部为负的移动的机会.这样一 
个序列就产生了价格运动的局部趋势. 

为了允许正负价格运动之间的不同动态性，我们对价格变化的人小采用不同的 
模型.具体来讲，我们有 

•StKD* = -1, F<_i) ~ p(A d>1 ) I 1, ln(Ad,») 

= r fiI,D + ”d，lNi + 7]d,2 ln(Afi) -h T/d,3<5i-i ， (5.52) 

Si\(Di = l,Ni, At it Fi-i) ~ p(X« ， i ) 十 1 ， ln(A tl ,i) 

= Vn,o + +t?u. 2 MA/i) 4 - Vu,3Si-i, (5.53) 

其中 / HA ) 表示参数为 A 的泊松分布.在大小中加入 1 是因为当价格变化时最小的 
大小为1个最小价位变动鱼位. 
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方程 (548)-(5.53) 中指定的模型可以通过最大似然方法或 MCMC 方法来联 
合估计.根据方程（5.47)，这些模型包含了 6个可以单独估计的条件模型. 

例 5.5 考虑 IBM 股票在 199() 年11月21日的曰交易.在正常的交易时间有 HJ 4 
个价格变化.图 5-15 给出了 1»(以,)，况， D , 和 . S ’， 的直方图 D , 的数据在“上升” 
与“下降”运动中大约是平等分布的只有极少数交易导致了大于1个价位变动争 
位的价格变化事实上有7个具有2个价位变动单位的变 化：有 1个具有3个价 
位变动单位的变化.利用 MCMC 方法（洋见第12章)，我们对数据得到下面的模 
型.描述的估计及其标准差是9 500次迭代中 MCMC 抽取的后验均值和标准差. 
价格变化的时间持续期模型为 


ln(At<) = 4.023 +0.032 ln(Aii_i)- 0-025S<_i + 1.403e“ 

其中系数的标准差分别为 0.415, 0.073. 0.384 和 0.073. 拟合的模型 显示 在时间持续 
期中没有动态相依性. 刈变 置况.我们有 


Pr(AT, > 0\Ati,Fi x ) = 1ogit[-0.637+ 1.740 In(Ati)], 


其中估计的标准差分别为 0.238 和 0.248. 这样，在时间间隔 （ U ) 上无价格变 
化的交 易数置 正向依赖丁-间隔的长度.当 AT , > 0时,其大小为 


^»|(^, > 0. F,_i) 〜1 + g(X t ), 


exp [0.178-0.910 ln ( A ^)] 

1 + exp [0.178- 0.910 ln ( A~)j 


其中估计的标准差分别为 0.246 和 0.138. ln ( A ^) 的显著的负系数意味着 AT , 与持 
续期的长度是 TH 相关的.因为大的 In ( A ^) 预示着一个小 的；^ 从而隐 含了恥 
以更高的概率取大的值可以参见方程 (5.27) 中的几何分布. 


图 5-15 
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大小以最小变动价位测鼠 交易数 

IBM 股票在 1990 年 11 月 21 日的日内交易数据的直方图 ： （ a ) 价格变化间的 
对数持 续期； （ h ) 价格变动的 方向； （ c ) 以最小变动价位测最的价格变化的 大小; 
( ci ) 无价格变化的交易个数 










对 D , 拟合的模型为 
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m = 0.049 - 0.840£>,_1 - 0.004 ln ( A ^), 
ln ( orj ) = 0.244 十 D 卜 2 + 认 — 3 + \ > 

其中均值方程中参数的标准差分别为 n .129, 0 I 32 和 0.082, 而方差方程中参数的标 
准差为 0.182. 价格逆转可以从 D , 1的高度显著的负系数中清楚地显示出来.方 
差方程的边际显著参数也正好是所期望的.最后.对价格变化大小的拟合模型为 

ln ( Ad . i ) = 1.024 - ().327^ + 0.412 ln ( Ati ) - 4.475 i_ lr 

ln ( A u ， i ) = -3.683 - 1.542 iVi + 0.4191 n ( A ^) + 0.9215,_ x , 

其中“下降大小”参数的标准差分别为 3.350, 0.319, 0.599 和3.188,而“上升 大小” 
的参数的标准差分別为 1.7 34 , 0.97 G ，0.4 M 和 1.459. 上述两个方程令人感兴趣的地 
方是况的系数的估计值为负数.个大 iV , 意味着在时间间隔 («,_!, t .) 屮有更多 
的交易没有价格 变化. 这可以看作是时间间隔中没有可以利用的新信息 
的 证据. 因此，^时刻价格变化的大小应该比 较小. 泊松分布中的小 A u ，与 A d , 精 
确地说明了这一点. 

总之，假定给定某天的194个观测值样本可能不包含关于 IBM 股票交易动 
态的充分信息，但是拟合的模型看上去提供了一些合理的结果. McCulloch 和 Tsay 
(2000) 把 PCD 模型扩展到一个分级结构框架，来处理从 199 U 年11月1日至1991 
年1月31日之间的所有63个交易日的 数据. 有超过19 000个观测值,许多参数 
估计在这个扩展模型中都是显 著的. 例如，在时间持续期模型中，的系数 
的全部估计从 0. U 4 到 0.1 变化. 尽管这种变化比较小但是很显著 • 

最后，利用交易数据来检验微观结构理论通常需要仔细地指定所用变量它也 
要求对市场运作的方式与数据收集有更深刻的理解.然而，本章中讨论的计量经济 
模型的思想很有用，并且它已在高频数据分析中得到广泛应用. 

附录 A —些概率分布的回顾 

指教分布 

称随机变量 X 服从参数为 0(0 ：> 0) 的指数分布，如果其概率密度函数 ( prob ¬ 
ability density function . 以下简记为 pdf ) 由下式给出 

\ 若0 0， 

nm = l 0 

I 0, 若 ar < 0. 
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为 


韦布尔分布 

称一个随机变量义服从参数为 a, ( 3(a > 0,(3 > 0) 的韦布尔分布.如果其 pdf 




0， 


若 x > 0 , 
若 X < 0, 


这里/?和《分别为分布的尺度参数和形状参数 . X的均值、方差分别为 


E(X) = ( 3T 




X的 cdf 为 


F { x \ ot ,( 3 ) 


{ 


0 . 

1 _ e -(x//?r 


若 x < 0, 
若 X > 0. 


当 or = 1时，韦布尔分布简化为指数分布. 

定义 y = x/[m’(i + 3)]. 我们有 E(y) = 1，而且 r 的 pdf 为 


f(y\ot) = 


。[«)] 广 iexp H r (on 

0 , 


若 y ^ 0 , 
若 y < 0 , 


(5.55) 


这里由于标准化，所以尺度参数消失 r. 标准化的韦布尔分布的 《if 为 


F { y \ ot ) = < 



若2/ <0, 
若 y > 0. 


并且我们有 E(y) = 1， Var(r) = T(1 + |)/fr(i +/ a )p — 1 . 对于带韦布尔分布新息 
的持续期模型，最大似然估计中利用的就是上述的 pdf. 

广义伽玛分布 

称随机变量X服从参数为 ct , 汍 >()./?> t), K > 0) 的广义伽玛分布如果 
它的 pdf 由下式给出 


( ax ka ~ l 

「 

f ( x \ a , fl , K ) = \ 0 ka r ( K ) exp 

.w . 

u 



，若 x > 0, 
其他， 


其中是尺度 参数. 《， K 为肜状参数.这个分布可以写为 




214 第 5 章高频數据分析与市场微观结构 


这里 C 是参数为的标准伽玛随机变量 . X 的 pdf 可以通过变量代换的方法由 G 
得到.类似地， X 的矩可以从方程 （5.54) 中 G 的矩得到. 

E(X-) = E[(/?r7 l /«)m| = prn E(G m/ a) = ^-£^±11 = . 

当 K = 1时，广义伽玛分布简化为韦布尔分布.这样，指数分布和韦布尔分布 
都是广义伽玛分布的特殊情况. 

广义伽玛分布的期望为 f .( x ) = /? r (« + ^)/ r ( K ). 在持续期模型中，我们需要 
—个带申位期望的分布.因此，定义随机变量 Y = xx / fl , 这里 a = r ( K )/ r(K + 去), 
则有 E ( y ) = 1， r 的 pdf 为 


f { y \ a , K ) = < 


1 

A fcu r ( K .) 


exp 


[-(!) 



0, 


若 y > o , 
其他， 


(5.56) 


这里 0 仍然是尺度参数 ， A - i »/ r (« 十 i ). 

附录 B 危险率函数 


对持续期建模时一个有用的概念是由分布函数隐含的危险率函数.对随机变 
量入，生存函数定义为 


S{x) = P(X > x) — I — P(X < a?) = 1 — cdf(x), t > fl. 


这给出了服从 X 分布的每个事物在时刻 《 生存的概率 . X 的危险率函数(或强度函 
数 J 定义为 

h ^ = WY ㈣ 

其中 /(.) 和 s (.) 分别是 X 的 pdf 和生存函数. 

例 5.6 对于参数为《、/3的韦布尔分布，生存函数与危险率函数分别为 


S{x\cn ， l3) = exp 



h(x\a,(3) = x > 0. 


特别地，当《 = 1时，我们有 h(x\0) = \/P ， 因此，对于指数分布而言，其危险率函 
数是常数，对于韦布尔分布，危险率函数是单凋的 • 如果« > 1,那么危险率函数是 
单调递增的，如果 a < 1，那么危险率函数是单凋递 减的. 对广义伽玛分布，生存函 
数以及危险率函数都涉及不完全伽玛函数.然而危险率函数可以有各种不同的形 
状，包括 U 型以及倒 U 型.这样，广义伽玛分布提供了对股票交易的持续期建模的 
一个灵活方法. 
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对标准化的韦布尔分布，生存函数以及危险率函数为 


S ( y \ a ) = exp H r (0] 

"(y|a) = or j^r ^1 -f ^ 


y > o. 


附录 C 对持续期模型的一些 RATS 程序 


运用的数据是 IBM 股票从1990年11月1 H 至11月9日每日交易的调整后 
的时间持 续期. 文件名为 ibmlt 05. txt , 共有3 534个观测. 

估计 WACD(1,1) 樸型的程序 

all 0 3534:1 

open data ibmlto5.txt 
data(org=obs) / x rl 
set psi = l.o 
nonlin aO al bl al 

frml gvar = aO+al*x(t-l)+bl*psi(t-1) 

frml gma = %LNGAMMA (1.0+1.0/al) 

frml gin < 匕 ） +log {al) - log (x (t) ) $ 

+ al*log <x (t) / (psi (f.) =gvar (t) ) ) - (exp (gma (t) ) *x(t) /psi (t) ) **al 
smpl 2 3534 

compute aO = 0.2, al = 0.1, bl = 0.1, al = 0.8 

maximize(method=bhhh,recursive,iterations=130) gin 

set fv = gvar(t) 

set resid = x(t)/fv(t) 

set residsq = resid(t)*resid(t) 

cor(qstats,number=20,span=10) resid 

cor(qstats,number=20,span= 10 ) residsq 

估计 GACD(1,1) 模型的程序 

all 0 3534:1 

open data ibmlto5.txt 

data(org=obs) / x rl 

set psi = 1.0 

nonlin a0 al bl al ka 

frml cv = a0+al*x(t-l>+bl*psi(t-1) 

frml gma = % LNGAMMA(kd) 

frml lam = exp(gma(t))/exp(%LNOAMMA(ka+(1.0/al))) 
frml xlam = x(t)/(lam(t)*(psi(t)=cv(t))) 

trml gin =-gma(t)+log(al/x(t))+ka*al*log(xlam(t)) - (xlam(t))**al 
smpl 2 3534 

compute aO = 0.238, al = 0.075, bl = 0.857, al = 0.5, ka = 4.0 

nlpar(criterion=value,cvcrit= 0 . 00001 ) 

maximize(method=bhhh,recursive,iterations=150) gin 
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set fv = cv(t) 

set resid - x(t)/fv(t) 

set residsq = resid(t)♦resid(t) 

cor(qstats,number=20,span=10) resid 

cor(qstats,number=20•span=10) residsq 

估计门限一 WACD (1,1) 模型的程序 

指定的门限为 3.79 
all 0 3534:1 
open data ibmlto5.txt 
data(org=obs) / x rt 
set psi = 1.0 
nonlin al a2 al bO b2 bl 

frml u = {(x{t-l)-3.79)/abs(x(t-l)-3.79)+1.0)/2.0 

frml cpl = al*x(t-1)+a2*psi(t-l) 

frml gmal = %LNGAMMA(1.0+1.0/al) 

frml cp2 = b0+b2*psi(t-l> 

frml gma2 = %LNGAMMA(1•0+1•0/bl) 

frml cp = cpl (t) Ml-u(t) )+cp2 (t) *u(t) 

frml glnl =al*gmal(t}+log(al) log(x(t)) $ 

+al*log(x(t)/(psi(t)=cp(t))) - (exp(gmal(t))*x(t)/psi(t))**al 
frml gln2 =bl*gma2(t)+log(bl)-log(x(t)) $ 

+bl*log(x(t)/(psi(t>=cp(t)>)-(exp(gma2(t))*x/psi(t) 
frml gin - glnl (t )^ (1 u(t )) »gln2 (t)*u (t) 
smpl 2 3534 

compute al = 0.2 f a2 = 0.85 # al = 0.9 
compute bO = 1.8, b2 = 0.5, bl = 0.8 

maximize(method-bhhh,recursive,iterations ， 150) gin 

set fv = cp(t) 

set resid = x(t)/fv(t) 

set residsq = resid(t)*resid(t) 

cor(qstato,number»20,epan=10) resid 

cor(qstats # number=20,span=10) residsq 


练习题 

5.1 令 r t 为资产在 f 时刻的对数收益率.假定 { r ,} 是均值为0.05、方差为 1.5 的高斯门噪 
声.还假定在每个时间点交易发生的概率为40%.并丘交易是否发生 h r , 独立.用表 
示观测到的收益率.问 | r ? 是序列相关的吗？如果回答是肯定的，请计箅4的前3步延 
迟相关系数. 

5.2 令 P , 是观测到的资产的芮场价格，它通过方程 (5.9) 与资产的基本价值相联系.假定 
ap ； = p ； - 是一个均值为0,方差为 1.0 的高斯白噪声序列，并假定买卖报价差为 

2个最小变动价位 .问： 当最小变动价位是1/8美元时，价格变化序列△巧= P « - P,-i 
的一步延迟自相关系数是多少？当 M 小变动价位是 1/1 G 美元时，价格变化的一步延迟自 
相关系数是多少？ 

5.3 文件 ibm - d 2- dur . txt 包含了 IBM 股票1990年11月2日交易之间调整的持 续期. 这个 
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文件有3列，含有天、从午夜开始以秒测1的交易时刻以及调粮持续期. 

( a ) 对调整持续期建立一个 EACD 模型，并检验拟合的模型. 

( b ) 对调整持续期建立一个 WACD 模型，并检验拟合的模型. 

( c ) 对调整持续期建立一个 GACD 模型，并检验拟合的模型. 

( d ) 比较前面的3个持续期模型. 

5.4 文件_ 9 91 2 -0^^.1又1;包含了 3 M 公司的股票在1999年12月的交易数据•有3 列：这 
个月的大' 从午夜开始以秒测量的交易时刻、交易 价格. 排除了东部时间4:00以后发生的 
交易. 

(») 3 M 股票交易具有日模式吗？你可以构造一个时间序列叫，用它表不每5分钟时間间 
隔内的交易数最来回答这个问题. 

( b ) 利用价格序列来确认 3 M 股票的日内交易中买卖报价弹性的存在性. 

( c ) 以灿小变动价位1/16美元的倍数将价格变化的频率 列表. 你可以将变化为最小交动 
价位的5倍或超过5倍的分成一类.变化为最小变动价位的 -5 估或起出一5倍的 
作为另一类. 

5.5 再次考虑 3 M 股票在1999年12月的交易数据 

( a ) 利用此数据构造曰内每5分钟的对数收益率序列，利用毎 S 分钟间隔内所有交易价 
格的简单平均作为这个间隔的股票价格 •问： 此序列是序列相关的吗？你可以利用样 
本自相关函数的前10步延迟值的 Ljung - Box 统计量来检验这个假设. 

( b ) 在正常的交易口共有77个每5分钟收益率.某些研究者建议可以用口内的每5分钟 
收益率的平方和作为日波动率的一个度量.采用这个方法，并计算 3 M 股票在1999 
年12月的对数收益率的口波动率.讨论用这样的方法来估计日波动率的有效性. 

5.6 文件_ 9912- adur . txt 包含了 3 M 股票在1999年12月调整的日交易持 续期. 在一个 
夂易日内 f ! 39个毎 H ) 分钟的时间间隔. 令 d , 为 1999年12月所有的交易日内第 i 个 
1( J 分钟间隔的所有对数持续期的 平均. 定义调整的持续期为 ~/ exp ( d ,)， 其中 j 是在第 
个10分钟间 隔内. 注意到更多的力法可以用米调整交易持续期的 tl 内模式.这里我们仅 
仅使用局部平均. 

( a ) 在调整的持续期序列中有日模式吗？为什么？ 

< b ) 利用指数新息对调整的序列构造一个持续期模型并检验拟合的模型. 

( c ) 利用韦布尔分布对调整的序列构造一个持续期模型并检验拟合的模型. 

⑺）利用广义伽玛分布调整的序列构造一个持续期模型并检验拟合的模型 • 

( e ) 比较并评论前面构诰的3个持续期模 

5 7 为了得到分析商频金融数据的经验，考虑 GE 股票从2003年 I 2 月1 H 到12月5曰的 
交易数据，该数据包含在文件 taq - t - ge - dec 5 . txt 中. 文件有4大列： FI 期，时间（小时， 
分钟，秒)，价格和交 易量. 忽略正常交易时间之外的交易（即东方时间上午9: 30到下午 
4: 00)，对于每隔5分钟交易的数量建立一个时间 序列. 在所构建的时间序列中有每日特征 
吗？为回答该问题，你可以简单计算序列的样本 ACF . 交易数量在文件 taq - ge - dec 5- nt . txt . 
5.8 冉次考虑 GE 股票从2003年12月1日到12月5日的交易数据，忽略正常交易时间 
之外的 交易. 构建 H 内每隔5分钟交易的收益率序列.注意到5分钟时间间隔（例如从 
9: 3 【）到9: 35) 的股票价格为该时间间隔内最后一次交易的 价格. 为简便.忽略隔夜收益 
率.每隔5分钟的收益串序列有序列相关性吗？用延迟为 1 U 的 ACF 和5%的显著性水 
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平讲行检验.参见文件 taq - ge - dec 5-5 m . txt . 

5.9 考虑习题 5.8 中同样的问题，但是用每 in 分钟间隔的数据.参见文件 taq - ge - decS - lom - 

txt 

5.10 再次考虑 GE 股票的髙频数据.忽略正常交易时间之外的交易.计算样本中两个连续交易 
没有价格变化的百分比. 
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第 6 章连续时间模型及其应用. 

金融资产的价格随时间变化，形成一 个随机 过程. 随机过程是用来描述一个随 
机变量随时间变化的统计 术语. 观测到的价格是随机过程的一个实现.随机过程的 
理论是对观测到的价格进行分析和作出统计推断的基础. 

有两种随机过程模型可用来对资产价格建模.第一种称为 离散时间随机过程, 
其中价格变化发生在离散的时间 点上. 前面章节讨论的过稈都属于此类型.例如， 
纽约证券交易所 IBM 股票的曰收盘价就组成了一个离散时间的随机 过程. 这里价 
格只在一个交易日的收盘时刻发生 变化. 一个交易日内的价格运动不一定与观测 
到的日价格 有关. 第二种炎型是连 续时间的随机过程, 尽管价格只在离散时间点上 
可以观测到，但价格变化是连续的.可以将价格认为是股票的“真实价值”.它总是 
存在而且是时变的. 

則两种类型的随机过程.价格叫以进连续的或者离散的.一个连续的价格可以 
假定为任何正实数，而一个离散价格只能假定为其可能取值构成的一个可数集合 
假定资产价格是一个连续时间的随机过程.如果价格是-个连续的随机变量，那么 
就有一个连续时间的连续 过程. 如果价格本身是离散的，那么我们有一个连续时间 
的离散过程.对于离散时间过程也可以有类似的分类.第5章中的价格变化序列是 
离散时间的离散过程的一个例子. 

本章将资产价格看作是一个连续时间的连续随机过程我们的目的是引入对 
金融资产和价格运动建模需要的统计理论和工具 . 本章的开始将介绍本章中使用 
的一些股票期权的技术.在 G.2 节，我们对布朗运动 (Bmwnmu motion) (也称为维 
纳过程 (Wiener process)) 作一个简要的介绍.然后我们讨论了一些扩散方程以及 
随机方程，包括著名的伊藤引理 （Ito lemma). 大多数期权定价公式是在资产价格 
服从一个扩散方程的假设下推导出来的.我们利用 Black-Scholes 公式（以下简称 
为 B - S 公式）来表示这种 推导. 最后，为了处理稀有事件（比如一个利润瞀告）引起 
的价格变化，我们也研究 / — 些简单的带跳跃的扩散模型. 

如果资产价格服从一个扩散方程，那么附随于资产的期权价格可以利用对冲 
( hedging ) 方法推导出来.然而.有跳跃的时候.市场将变得不完全从而不存在完全 
的期权对冲.此时期权的价格或者利用跳跃风险的分散性来估价，或者定义一个风 
险的度量，然后选择_个价格和对冲来最小化这个 风险. 对于随机过程在衍生产品 
定价过程中的基本应用，参见 Cox 和 Hubinsteiu ( 1985) 以及 Hull (2002). 
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6.1 期 权 

股票期权是一个金融契约.它赋予持有者在特定的円期、以一个指定的价格 
交易一个指定的普通股票特定份额的 权利. 它有两种类型. 看涨期权 赋予持有者买 
某种标的资产的权利，其正式的定义见第 3 章. 看跌期 权赋予持有者卖某种标的资 
产的权利.契约中指定的价格 称为敲定价格或执行 价格. 契约规定的日期称 为到期 
日或截至日.美式期权可 以在到期日之前的任何时刻执行， 欧式期权 只能在到期曰 
执行. 

股票期权的价值依赖于标的资产的价值•令尺表示敲定价格 ，户 是股价.看涨 
期权当 P > K 时，賺钱；当 P = K B ' j ,不赔不赚；当 P < K 时，赔钱.看跌期权当 
P K 时， 赚钱： 当 P = K 时，不赔不赚；当厂> K 时， 赔钱. 一般而言，一个期权 
如果立即执行将对持有者导致正的现金流时则是赚钱的.期权如采立即执行将別 
股票持有者导致负现金流时则是赔 钱的. 最后.期权如果立即执行将导致0现金流 
时是不赔不赚的.显然.只有赚钱的期权在实际中才会被执行.要得到更多关于期 
权的信息，参见 Hull (2002). ‘ 

6.2 一些连续时间的随机过程 

在数理统计中，连续时间的连续随机过程定义在一个概率空间 （a 厂 p ) 上，其 
中 n 是非空空间， F 是一 个包含 Q 的所有子集的 cr- 域， P 是概率测度.具体可 
参见 Billingsley (1986) 的第1章.过程可以写为{_，*)}•其中 * 表示时间并且在 
[0,oo) 上连续.对于给定的/，是一个实值连续随机变量（即从 n 到实直线上 
的一个映射)， r； 是$2的元素.对于资产在时刻 f 的价格, x ( r h t ) 的取值范围是非负 
实数集.对于一个给 定的％ {x(r?,t)} 是一个时间序列，其值依赖于时刻 t. 为了简 
便，我们将连续时间随机过程写为可以将其理解为，对于给定的是一个 
随机变量.在文献中. 一些 作者为了强调《是连续的，运用40来代替;然而我 
们利用相同的记号但是称它为一个连续时间随机过程. 

6.2.1 维纳过程 

在离散时间经济计量模型中，我们假定“抖动”形成一个白噪声过程 (White 
noise process), 它是不可预 测的. 连续时间模型中“抖动”的对应部分是什么？答 
案是—个维 纳过程 (也称为标 准布朗 运动）的增量有很多方式定义一个维纳过程 
{叫}.我们利用与在时间上的小增量相关的小变化 △叫 = + - m 的—个 
简单方法.一个连续时间随机过程 h ， t } 是一个维纳过程，如果它 满足： 

(1) Aw t = tVAi, 其中 e 是一个标准正态随机 变量； 

( 2 ) 厶抑与 u / j 独立，对于所有的 X 
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笫二个条件是个马尔可夫性 • 说明在当前值 w ; t 的条件下，该过程过去的任何新 
息 Wj(j < t ) 与将米值(/ > U ) 是不相关的.由这个性质很容易看出，对任意 
两个不相交的时间段与，增量 u; tl+Al - w tx 与增量 w t 2+ A ,- w t 2 是独立的. 
在金融屮，这个马尔科夫性与弱式有效市场是相关的. 

由第一个条件，△ ㈣ 是均值为0、方差为的正态分布.也就是说，△叫〜 
AT (0, A 0. 这里〜表示概率 分布. 下面考虑过程叫.我们假定过程开始于 f = 0,初 
始值为1^0,这个值是固定的，而且通常设定为 0. 从而 w t - w 0 可以看作是许多微 
小增量 的和. 更具体地讲，定义 r = 各，这里 △/. 为一个很小的正增量，则 

T T 

w t — w 0 = w T At. — w a = ^ Awi = ^ £名 

1=1 1=1 

其中△叫= w ; iA , - w { i _ 1) Al . 因为诸 ei 是独立的，所以我们有 

T 

E ( u’ t — w Q ) = 0, Var ( w; t — w a ) = At = TAt = t . 

i=l 

这样， w t JAo 时刻到 / 时刻的增量是均值为0、 方差为 t 的正态 分布. 规范地表示 
为，对于维纳过程叫，我们有 - WQ 〜 N (0: t ). 这说明一个维纳过程的方差随带 
有时间区间长度的线性性质而增加. 

图 6-1 给出的是单位时间区间 [0, 1] 上4个模拟的维纳 过程. 它们由在统计学 
文献中的 Donsker 定理的一个简单形式（参见 Douakcr (1951) 或 Bilingsley (1968)) 
得到.取 n =3 000. 这四幅图都幵始于 u ; 0 = 0. 但是当时间递增时漂移分开.说明维 
纳过程的方差随时间递增.可以用一个从 [0,1] 到 [0, oc ] 的一个简单的时间变换来 
得到/ € [0, oo ] 上模拟的维纳过程. 




图 6*1 4个模拟的维纳过程 
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Donsker 定理 

假定 { Zi ) U 是一个相互独立的标准正态随机变量的序列.对于任意《 e [0,11， 

令 [ n *】 表示 nt 的整数部分.定义= $ I ： 1 则当 n 趋于无穷时，依分 

布收敛到一个在 [0,1] 区间上的维纳过程购/ _ 

产生维纳过程的 S - Plub 命令 
n = 300 

epsi = rnormCn, 0,1) 
w = cumsum (epsi)/sqrtCn) 
plot (w, type=’l ’） 

注释 1: 概率空间 { HRP ) 上的一个布朗运动叫的正式定义为：对于 t ^0 t 
它是一个具有独立平稳增量的实值连续随机 过程. 换句话说，叫满足 

(1) 连续性：从 < 到叫 的映射关于概率测度 P 几乎处处连续： 

(2) 独立增量：如果 S 则对于所有 的 v $ a , w t -叫与 叫.独立； 

(3) 平稳增量：如果 S 彡则 W; t - 叫，与 Wt - a - ^0 具有同样的概率分布. 

可以说明增爹 - w , 的概率分布是均值为 "(/ — s )、 方差为 a 2 ( t - s ) 的正态分布. 
而且，对于任意给定的时间指标 n ^ < • *• < « ic , 随机向量 , w t J 

服从一个多元正态分布.最后，如果 t»o = 0几乎处处成立 ， /i = 0且 a 2 = 1， Rij 布 
朗运动是标准的. □ 

注释2:布朗运动的一个重要性质是它们的路径几乎处处不可微.换句话说， 
对一个标准布朗运动叫，对于中除了满足 P ( fii ) = 0的子集舍 C 以外的 
所有元素 （1 抑 / tU 都是不存在的.囚此，当考虑资产的时间价值时.我们不能运用通 
常的积分求和来处理涉及一个标准布朗运动的积分，必须寻求另外一种 方法. 这就 
是下一节中讨论伊籐积分的目的. 口 


6.2.2 广义维纳过程 

维纳过程是一个特殊的随机 过程： 具有0漂移率以及有与时间间隔的长度成 
比例的方差.这意味着期望的变化率为0而方差的变化率为 1. 在实践中，随机过 
程的均值和方差可以以一种更加复杂的方式随时间演变，因此需要随机过程的进一 
步一般化.为了这个目的，我们考虑期望漂移率为 M . 方差变化率为/的广 义维纳 
过程.将这个过程用来表示.并且用记号 dy 表示变 i 2/的一个微小变化，则 A 
的模型为 

= /xdt + adwt, (6.1) 

其中叫是一个维纳过程.如果我们考虎方程 (6.1) 的离散形式，那么对于从0到尤 
的增量为 


— Zo — 〆 + (7£y/t. 



6.3 伊藤引理 223 


因此， 

E(xi — Xo) = "i ， Var(a；t — 戈 o) : = a 2 t. 

结果说明： r t 的增量对期望的增长率为 / i , 对力差的增长率为 a 2 . 在文 献屮， 力程 
(6.1) 中的 p 与 a 称为广义维纳过程而的漂移参数和波动率参数. 

6.2.3 伊藤过程 

广义维纳过程的漂移参数和波动宇参数都不随时间变化.如果进一步扩展模 
型，允许 p 和〃是随机过程: r t 的函数，那么我们就有了一个伊藤过程.具体来讲， 
过程 A 是一个伊藤过程，如果它满足 

dx t = n(xt, t)dt + a(x f l t)dw t , ( 6 . 2 ) 

其中叫是一个维纳过程.这个过程在数理金融中起着很重要的作用，可以写为 

•e ft 

x t =x 0 + / x ( x s , s ) d.s + < r ( x „, s ) dw .,, 

Jo Jo 

其中表示过程在 0 时刻的初始值，右面的最后一项是一个随机枳分.方程 (6.2) 
称为一个随机扩散方程， 咖，0和 ^ t , t ) 分别是漂移函数和扩散函数. 

维纳过程是一个特殊的伊藤过程，因为它满足方程 （6.2) 中取 / i ( x tl t ) = 0且 
a ( x t , i ) = 1 的情形 • 


6.3 伊藤引理 


金融中利用连续时间模型时，通常假定资产的价格是一个伊藤过程.因此，为 
了导出金融衍生资产的价格，需要利用伊藤积分.本节主要回顾一下伊藤引理，并 
将它看作是微积分中微分运算的自然推广.伊藤引理是随机积分的基础. 

6.3.1 微分回顾 

令 G ( x ) 表示: r 的可微函数.利用泰勒展开，我们有 

. a 、 c 、 dG 〜 1 谷 2 (7, A 、 2 1 巧 3 r?, A 、 3 

AG = G[x + Ax ) - G { x ) = -^Ax + + 6^* (Ax) +•... 

当△: r 一 0 时取极限，并且忽略 Ax 的高阶项，我们有 









伊藤引理 

假定: r t 是一个连续时间的随机过程，满足 


= fi [ xt , t)dt -f a ( x t , t ) duJt ., 


其中 A 是一个维纳过程.另外. G ( x t , t ) 是〜和 t 的可微函数.那么 

w \dG ( . dG t Xd^G 2t A ^ f)C , …、 

dG= [~dx ^ + ~at + 2 ~dx^ a ^ Xt 1 dt+ ( 6 . 6 ) 

例 6.1 作为一个简单的解释，考虑维纳过程的平方函数 G ( uj t , t )= ujf . 这里我们 

有 n { uj t , t ) = U t a { u) ty f ) = 1,而且 


dG 

duj t 


2^t, 





因此， 

du;f = (2 uJ t xO 十 0 十秦 x 2 x l)dt + 2 uj t duj t = dt + 2 uj t du } t . 

6.3.3 一个应用 


(6.7) 


令 Pt 表示一只股票在时刻 /. 的价格，它在 [0, oo ) 上连续.文献中通常假定朽 
服从一个特殊的伊藤过程 


AP t = ^iP t dt 4- rrP t duJt, (6.8) 

其中 /x 与 tr 都是固定的.利用方程 （6.2) 中一般伊藤过程的记号，我们有 ^( x tl t ) = 
< r { x t , t ) = ( TX t , 这里 rr t = P t . 这样一个特殊的过程称为 几何布朗运动 （ Geo ¬ 
metric Brownian Motion ). 现在我们利用伊藤引理来得到针对股价巧的对数的一 
个连续时间模型.令 G ( P t , t ) = ln ( Pr ) 表示标的股票的对数价格，则我们有 

dG _ 1 dG 1 d 2 G 1 (- 1 ) 

dP t = ¥ t ' ~dt = ' I'dPf = 2~Pf' 

因此，根据伊藤引理，我们得到 

d ln ( P t ) = (―^ p2 ) 出 + ■^■aPtduJt = - ^ + 

这个结果说明如果价格是一个几何布朗运动，那么价格的对数服从一个一般的维纳 
过程,其漂移率为 / i - rr 2 /2, 方差率为 a 2 . 因此，价格的对数（即对数收益率）从当 
前时刻 f 到将来某时刻 r 的变化服从均值为 （/x - a 2 /2)( T - t ), 方差为 a 2 ( T - t ) 
的正态分布.若时间间隔 T-t = A 是固定的，而且我们更感兴趣于对数价格的等 
间隔的增蛩,那么增量序列就是一个均值为 (//- a 2 /2) A , 方差为的高斯过程. 
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6.3.4 和 (7 的估计 

方程 (6.8) 的几何布朗运动中的两个未知参数 ,i ^ a 可以用经验方法来估 
计.假定我们有股价 P , 在时间间隔△(例如日、周或者月）上的 n 4 1个观测值， 
可用年来度量 △. 观测到的价格表示为 {Pu,P lt - - ,P„}, 并且对 * = 1 .…， n , 令 
U = hi(P t ) — ln ( P t _ i ). 

因为 A = P f _, exp ( r t ), 其中 r t 是第/,个时间间隔上的连续复合收益率.利用 
前—小节中的结果并且假定股价朽服从一个几何布朗运动，我们得到 r , 服从均 
值为 (fi — < t 2 /2) A , 方差为 a 2 A 的正态分布.另外， r t 不是序列相关的. 

为了简便，定义/= E ( r t ) = (/i - < t 2 /2) A，of = Var ( r t ) = cr 2 △.令 f ， s r 分别 
表示数据的样本均值和标准差，即 






E (n - f ) 2 . 


正如第1章中提到的， f 与^分别是 r , 的均值和标准差的相合估计，即当 n oc 
时， f — /ir 且〜 > rx r . 因此，我们可以通过 


•s r 

a = —y= 


估计 (7. 另外.可以表明该估计值的标准差渐近于 b ! 孤 由$ = f ， 我们可以通 
过下式来估计 M 


当序列 q 是序列相关的.或者当资产价格小服从方程 (6.8) 中的几何布朗运动 
时，则必须运用其他的估计方法来估计扩散方程的漂移参数和波动率参数.稍后我 
们再讨论这个问题. 

例 G .2 考虑1998年 IBM 股票的日对数收益率.图 6-2 a 是数据的时间图，共有 
252个观测值.图 6-2 b 描述了序列的样本自相关.可以看出，对数收益率确实是前 
后不相关的 . L * B 统计量 ( Ljung-Box statistic ) 给出了 Q (10) = 4.9, 与自由度为10 
的 X 2 分布比较是高度不显著的. 

如果我们假定1998年 IBM 股票的价格服从方程 (6.8) 中的几何布朗运动，那 
么我们可以利用日对数收益率来估计参数 M 和 a . 由数据我们有 f = 0.002 27 G , 
. s r = 0.019 15. 闵为一个交易日等价干 △ = 〗/252 年，我们得到 


— - 2 

a = = 0.304 0, A = ^■十;= 0.619 8. 

V A △ 2 

因此在1998年， IBM 股票每年的期望收益率的估计为61.98%.标准差为30.4%. 
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m 6-2 年 IBM 股票的日收益率： （ a) 对数收 益率； （ b) 样本自相关性 


然而，日对数收益率的正态性假定可能并不成立.在这个特殊的例子中，偏度 
-0.404(0.153) 和超额峰度 2.396(0.306) 增加了某种关注,这里括号内的数字表示渐 
近标准误差. 

例 6.3 考虑1999年 Cisco Systems 股票的日对数收益率.共有252个观测值，样 
本均值和标准差分别为 0.003 32 和 0.0263 03. 对数收益率序列也表明没有序列相 
关性， Q ( 12)=10.8 甚至在10%水平下都是不显著的.所以，我们有 


a = 


71 


0026 303 
y /1.0/252.0 


= 0.418, 


A = ; + C = 0.924. 


A 


2 


因此， lyyu 年 Cisco Systems 股票的年期望收益率的估计为92.4%,标准差的估计 
为41.8%. 


6.4 股票价格与对数收益率的分布 

6.3 节的结果显示，如果假定一只股票的价格服从几何布朗运动 

dP t — ftPtdt + crP t du) t ^ 

那么价格的对数服从一般的维纳过程 

dln ( Pt ) = (/i - t 

其中尸< 为股票在 t 时刻的价格 . u ； t 是一个维纳过程.因此，对数价格从时刻 Z 到 
时刻 T 的变化是正态分布的，即 


ln (/ V ) - In ( Pt) 〜 W 




(6.9) 
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6.5 B - S 微分方程的推导 


本节利用伊藤引理和无套利假定.对于价值为巧的股票的衍生未定权益的价 
格推导其 B~S 微分方程.假定价格巧服从方程 ( G .8) 中的几何布朗运动，并且 
G t = G ( P t J ) 是关于巧的衍生未定权益（例如一个看涨期权）的价格.由伊藤引 
理，得 


dG t — 



".巧+ 


dG t 

~dt 


ld 2 G t 
2 OP ； 2 


) dt I 


dG t 

dP t 


erP t dwt . 


这个过程以及前面结果的离散化形式为 


= fiP t At -I- aP t Aw t , (6.11) 

(dGt „ dG t ld 2 G t A dG t 
AGt= KdPt^ + 2~dPf a Pt ) W ， PlAwt ， (6 . 12) 


其中 AP t , AG t 分别为 A 和 G , 在一个小时间区间 Ai 上的变化.因为对于方程 
(6.11) 和 (6.12) 都有 匕 w t = ch 所以可以构造不涉及维纳过程的股票与衍生资 
产的个组合.怡当的组合策略是卖空衍生资产并多头持有 g 的股份，用 Vi 表 
示组合的价值.由构造，可知 


v r 4 - p 

Vt= Gt+ dP ， 1 、 

(6.13) 

则的变化为 


△Vi = - AG t + 

dP t 

将方程 （ fi .11) 和 (6.12) 代入方程 （6.14), 我们有 

(6.14) 

耐 7/- 颂吟. 

(6.15) 

此方程并不涉及随机部分 A «, t . 因此，在无套利假设下，组合 V ；在一个小时间区 
间上一定是无风险的.换句话说，所用的假设蕴涵组合一定同时可以赚得与其 
他的短期无风险证券相同的 收益； 否则，在这个资产组合与短期无风险证券之间就 
存在套利机会.因此.我们有 

AVJ = rVtAt = ( rAt ) Vt , 

(6 16) 


其中 r 为无风险利率.由方程 (6.13) 到方程 (6.16), 我们有 


(警 + \wf° 2p * ) At = r ( Gt ~^ Pt ) At 
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所以 


dt 


+ rP t 


dG t 

'dPt 




= rGt. 


(6.17) 


这就是对衍生资产定价的 B * S 微分方程.可以通过解此方程来得到标的变量为八 
的衍生资产的价格. 

这样得到的解依赖于衍生资产的边界条件.对一个欧式看涨期权而言，边界条 

件为 


Gt = nm\(Pr — A", 0), 


其中 T 是到期时间， / C 是执行价格.对于一个欧式看跌期权而言，边界条件变为 


Gt = max{K — Pr , 0). 

例 6.4 作为一个简单例子，考虑股票的一个远期合约，不支付红利.在这种情况 
卜，合约的价值由卜式给出 


Gi = Pi K exp[ — t*(T — i)j, 

其中 K 是交割价格 （delivery price ), r 是无风险利率， T 为到期日.对于这样的一 
个函数，我们有 


dC t 

dt 


= — tK exp [— r(T — i )], 


dG t 

dPt~ 


d 2 G t 


= 0, 


将这些量代入方程 (6.17) 的左面得到 


—rK exp[—r(T — i)] rP t = r{P t K cxp[ r(T <)]}, 


等于方程 (6.17) 的右面.因此这的确满足 B - S 微分方程. 


6.6 B - S 定价公式 


Black 和 Scholes (1973) 成功地求解了方程 (6.17) 中的微分方程，并得到了对 
欧式看涨期权与看跌期权价格的精确公式.下面我们利用金融中所谓的风 险中性 
定价来推导这些公式. 

6.6.1 风险中性世界 


将漂移参数 M 从 B - S 微分方程中去掉、在金融中这意味着此方程是与风险偏 
好独立的.换句话说，风险偏好不能影响这个方程的解.此性质的一个完美结果就 
是能够假设投资者是风险中性的.在一个风险中性世界里，我们有如下 结论： 

• 所有证券的期望收益率都是无风险利率 r ; 

• 任何现金流的当前价值可以通过将它的期望价值以无风险利率折现得到. 
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6.6.2 公式 

在风险中性世界里，一个欧式看涨期权在到期日的期望价值为 

E*[max(iV — A'O )]， 

其中 E ， 表示在无风险世界中的期望价值.看涨期权在 f 时刻的价格为 

c t = ejcp [- r(T - «)]E.[max(P r - A ：,0)]. (6.18) 

然而，在风险中性世界里，我们有 p = r ， 并且由方程 （6.10)， ln ( P r ) 是正态分 布的： 

ln(/V) ~ N In ⑹ + (r- 誓 ) (T-OW-t) • 

令 9( Pt ) 表示 Pt 的概率密度函数.则方程中看涨期权的价格为 

'00 

c< = exp[—r(T — f)] {Pt — K)q(Pr)dPT- 

JK 

通过积分的变量变换以及一些代数计算（附录 A 中给出详细推导)，我们有 

c t = P t ^{ h + ) - K exp [— r(T — (6.19) 

其中 4>( x ) 是标准正态随机变量的积累分布函数在 z 点的值， 
h hx ( Pt / K ) + (r + a 2 /2)( T - t ) 

十 as/T^t 

K = ^W + ( r -. V 2)( T - t ) = ^ 

as / T-t 

实际中，中 ㈨ 可以很容易地通过大多数统计软件包得到.另外一种可供选择的方 
法，可以运用附录 R 中给出的一个近似 

方程 (6.19) 中的 B - S 看涨期权公式有一些好的解释.首先，如果在到期日执 
行期权，得到了股票，但我们必须要支付敲定价格.这个交换只有当期权是赚钱的 
(即 P T > K ) 时才会发生.当且仅当 P T > K 第一项 P t 中 ( h +) 是得到股栗的 
当前价值：当且仅当 Pr > KH , 笫二项 - A ： e x P [—, (T - L )]^( h _) 是支付执行价格 
的当前价声.第二个解释尤其有用.正如 （3.5 节中 B - S 微分方程的推导中显不的， 
屯 ( h + 、 = ( 韻 是资产组合中不涉及不确定性和维纳过程的股份的数量.这个量就 
是套期保值+易中众所周知的 △. 我们知道 c t = P t ^( h + )^ B t , 其中 A 为投资于 
资产组合（或衍生资产空头头寸）中的无风险债券的美元总量.可见从对 B - S 公式 
的检査中可以直接看出私= - A > xp [- r(T - /，)]4>(/ t _). 公式的第一项巧中 (/».+ ) 为 
投资在股票上的总量.而第二项 Xexp [- r ( T -0]^>(/ i -) 是借入的总量. 
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类似地，我们得到一个欧式看跌期权的价格为 

Pt = K exp[-r(r - t)]^(-h-) - P t ^{-h+). (6.20) 

因为标准正态分布是关于它的均值 0.0 对称的 1 所以我 们有： 对任何 J ：. ^( x ) = 
1- 伞(-工).利用这个性质，我们有^(-/,. 1 ) = 1-中(心) . 这样，计算一个看跌期权价 
格需要的信息与计算看涨期权价格所需要的信息是相同的.另外一个方法.利用正 
态分布的对称性，很容易证明 

Pt-c t = K exp [- r(T - t )] - P t , 

称之为涨 跌平价 公式，而且可用来从 c t 中得到外•涨跌平价公式也可以通过考 
虑下面两个组合来得到. 

(1) 组合 A : -个欧式看涨期权加 K exp [- r(T - i )] 的现金. 

(2) 组合 B : —个欧式看跌期权加一股标的股票. 

到期权的到期日这两个组合的盈利为 


inax(/V ， K). 

由于期权在到期日才能执行.组合必须与现价具有相等的价值.这意味着 


Ct ^ K exp[-r(T - t )] =/>, + P t , 


这正是前面所给出的涨跌平价公式. 

例 6.5 假设 Intel 股票的当前价格是每股80美元，年波动率为 a = 20%,进一步 
假设年无风险利率为8%.那么执行价格为 ( J () 美元，而且在3个月内到期的 Intel 
的一个欧式看涨期权的价格是多少？ 

由假设，我 们有巧 = 8(), 尺= 9()， T~t = 0.25, (j = 0.2, 且 r = 0.08. 

因此 


ln(80/flQ) 4- (0.08 4- 0.04/2) x 0.25 
0.2>/0^5 

h— - h 十一 0.2VK2E= —1.027 8. 


= -0.927 8, 


利用统计软件（例如 Minital ，或 SCA ) 或者附录 B 中的近似.我们有 


中 ( 一 0.927 8) = 0.176 7 ，中（ _1.027 8) = 0.152 0. 
因此.一个欧式看涨期权的价格为 


ct = $80^(-0.927 8) - $90^(-1.027 8) exp (— 0.02) = $0.73. 
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对看涨期权的买者而言.只有股价升高 10.73 美元时，才能达到得失平衡. 

在相同的假设下，一个欧式看跌期权的价格为 

p t = $90 exp (-0.08 x 0.25)^(1.027 8) - $8( 沖 (0.927 8) = $8.95. 

这样， 对于看跌期权的买者而言，股价可以升髙额外的 1.()5 美兀而达到得失平衡. 
例 G .6 骱面例子屮的敲定价格大大超出了当前股价.一个更现实的敲定价格是 
81美元.假设前面例子中其他的条件仍然成立，现在我们有 A = 80, K = 81， 
r = 0.08, T-t = 0.25,且 /»,变为 

ln (80/81) + (0.08^04/2 )x 0.25 = Q 125 
0.2>/0 L 25 

h . = h + - 0.2\/( i 25 = 0.025 775. 

利用附录 B 中的近似，我们有 $(0.125 775) = 0.550 0和 $(0.025 775) = 0.510 3,则 
一个欧式看涨期权的价格是 

Ct = $8( 沖 (0.125 775) - $81 exp (-0.02)4-(0.025 775) = $3.49. 

对于看涨期权的买者而言，股价必须提高 4.49 美元.才得失相等.从另一方面来讲, 
在同样假定下的一个欧式看跌期权的价格为 


p t = $81 exp (-0.02)$(-0.025 775) - $80^(-0.125 775) 

=$81 exp (-0 02) x 0.489 72 - $80 x 0.449 96 = $2.89. 

对看跌期权的买者而言.股票价格必须降低 1.89 美元，才得失平衡. 

6.6.3 欧式期权的下界 

考虑没有支付分红的股票的看涨期权.可以证明欧式看涨期权的价格满足 

ct ^ Pt — K exp [— r(T — t )]. 

也就是说欧式看涨期权的下界是 P ,-/ i ： exp [- r ( r - t )]. 考虑如下两个组合可以验 
证该 结果： 

(1) 组合 A : —个欧式看涨期权加 K exp [- r(T — t )] 的现金. 

(2) 组合 R : —股标的股票 - 

对于组合 A ， 如果将现金以无风险利率进行投资，则在 T 时刻的现金数量为 A ' 如 
果 Pr >圪则 r 时刻执行期权，组合的价值为 / V . 如果 Pr < A _， 则不执行期权， 
组合的价值为 A ：. 因此组合的价值是 


K). 
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组合 B 的价值在 r 时刻是 Pr . 因此组合 A 的价值要比组合13的价值大，或至少 
相同.从而今天组合 A 的价值也要比组合 B 的价值要大，即 

Ct + K exp [— r(T —<)] ^ P t , or Ct ^ Pt — K exp [— r(T — i )]. 

进一步，由于 c * > 0,我们有 

ct ^ max ( P t - K exp [— r(T - t )],0). 

用类似的方法可以证明，相应的欧式看跌期权满足 

Pt ^ max (/ v ’ exp [- r(T - ^)] — P ,, 0). 

例 6 . 7 假定8 = $ 3 0, K = $2 8 ,年利率为 r = 6%, T - i -0.5. 在这种情形下， 

Pt- K exp [- r ( T - t )] = $[30 — 28 exp (-0.06 x 0.5)] % $2.83. 

假定股票的欧式看涨价格为 S 2. S 0. 这比理论最小值 $2.83 要小.套利者可以买该看 
涨期权并卖空股票，这样便产生了一个新的现金流 $(30-2.50) = $27.50. 如果以无 
风险利率投资6个月，则 $27.50 变为 $27.50 exp (0.06 x 0.5) = $28.34. 在到期日，如果 
Pr > $28,则套期保值者执行期权，并平了空头头寸.他获利 $(28.34 - 28) = $0.34. 
另一方面，如果 P T < $28,套利者可以从市场直接买股票平仓，他甚至可以获得更 
多的 利益. 作为说明，假定 P 7 , = $27.00, 则获利将是 $(28.34 - 27) = $1.34. 

6.6.4 讨论 

由公式知,一个看涨或看跌期权的价格依赖于5个变量，即当前的股价巧、敲 
定价格 K 、 以年度量的到期日 T — t 、 年波动率以及年利率，， . 值得研究的是这 
5个变量对期权价格的影响. 

1. 边际效应 

首先考虑这 5 个变量对一个看涨期权价格 Ct 的边际效应.边际效应的意思是 
在固定其他变量的情况下改变其屮一个 变量. 一个看涨期权的效应可以概括如下. 

⑴当 前价格 巧： c f 与 lu ( P f ) 正相关.特别地，当戶, —() 时 ， Ct — 0;当 P , — oo 
时， c t — oo . 图 6-3 a 解释 f 尺= 80,年利率 r = 6%; T - t = 0.25 年以及年波动率 
a - 30%时的效应. 

(2) 执行价格 q 与 ln (/ C ) 负 相关. 具体来讲， 当尺 - 0 时， q — 行；当 
A * — » oo 时 ， Q — 0. 
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(3) 到期 时间： q 与 T - f 的相关性非常复杂,但是通过将/>,+和 / i - 写成 

, M 尸》 / 尺 ）. {r ^ o 0 /2)VT~^~t 

h + = ― /?r —— 7 +--- ， 

o \ 1 — t cr 

\ n { P t / K ) , ( r - a 2 / 2 ) VT-t 

/l 一 —— rPr< - ~•" " 1 

ay/T — t o 

( a ) (•>) 

I n 8 U - 


U 2()40 60 801(HI120 20 40 (M) 801(N)12l) 

当前股价 当前股价 

图6~3当前股价对期权价格的边际效应,其中尺= 80, T - i = 0.25, a = ().3, 
r = 0.06: ( a ) 看涨 期权； （ h ) 看跌期权 

可得到极限结果.若打< A ：. 则当 （T - 0 — 0时 Ct —() .若 P , >欠，则 a 
(T 0，0时4巧 K , 且当 （r t ) » oo 时 c t >巧.图 6-4 a 显示的是对三 
种不同的当前股价来说 ， r - (对 q 的边际效应.固定的变量是 /C = 80. r = 0.0 G 
和 u =0.3. 实线、点划线以及虚线分别对应于巧= 70. 80.90. 

⑷ (b) 


(>- 


(».() 0.2 0.4 (1；0 0.8 1：0 ().0 U.2 1).4 0.6 0.8 1.0 

到期时问 到期时 M 

m 6-4 当前股价对期权价格的边际效应，其中 A ' = 80 .a = 0.3 ,r = 0.06: ( a ) 看涨期权: 
( b ) 看跌期权.实线.点划线和虚线分别表示当前的股价为尸,= 70, 80, 90 





J 

i— I. fs 

G 4 2 


4(3(2(1( 

班佘适 S 始 _ 


1() 5 
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(5) 利率： Q 与 r 是正相关的， 满足： 当 r — oo 时， c ,— 心 

这5个变量对一个看跌期权的边际效应可类似得到.图 6-3 b 、 图 6-4 h 和阁 
6-5 b 对所选择的一些情况解释了其效应. 

2. 一些联合效应 

图 ( Mi 表明波动率与敲定价格对一个看涨期权的联合效应.这里其他变量是同 
定的，巧= 80, r = C %, T - 1=0.25. 正如所顸料的，当波动率很高而且敲定价格正 
好低十当前股价时，看涨期权的价格更高•图 6-7 显示同样条件下，对一个看跌期 
权的效应.当波动率很高而且敲定价格正好高于当前的股价时，看跌期权的价格更 
商. 而且，图形也说明了随着波动率的增加.敲定价格对看跌期权价格的效应将变 
得更加线性化. 


0.0 0.2 0.4 0.6 0.8 1.() 1.2 

波动率 


n o 0.2 ().4 0.6 O.vS 1.0 1.2 

波动丰 

81 6-5 股市波动率对期权价格的边际效应.其中 K = 80, T-t = 0 25, r = 0.06 : ( a ) 看涨 
期权； （ b ) 看跌 期权. 实线、点划线和虚线分別表示当前的股价为^=70,80,90 



(») 


( 1 >) 


⑷波动率 ( T : 通过将/1+和 / t _ 改写成 


/ 1 + 


ln ( P t / K ) A - r ( T - t ) 
rrs/T - / 




h JAhlI9^T-t)_a^ 


g^T — t — 

民们得到 （ a ) 如果 ln ( P t / A ") + r(T — /)< 0, 则当 一 0 时， 
n ( P t / K ) + r(T - > 0, 则当 a — 0 时 • c t » P , 


c t — 0; ( b ) 如果 
/ Cc _r(r - t) ; 当 cr -* oo 时, 


c , P t . 图 6 5 a 表明 K = 80. T / - 0.25, r = 0.0 G 以及 P , 取 3 个不同值时 <r 对 
f / 的效应.实线、点划线以及虚线分别对应于 P , = 70,80,90. 



( • 



妄 $as 拍 # 
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图6>7股市波动率与敲定价格对看涨期权的联合效应.其中 P t = 80, T - t = 0.25. r = 0.0(» 


6.7 伊藤引理的扩展 

在推导定价公式时.一个衍生资产可能是多种证券的未定权益.当这些证券的 
价格由多因索驱动时,衍生资产的价格就是几个随机过程的函数.利率期限结构的 
两因子模型就是二维随机过程的一个例予.在本节中，我们主要讨论伊藤引理在几 
种随机过程情形下的扩展. 

考虑一个维连续时间过程 a = ( x lt , … ,x kt y. 这里 a : 是一个正常数.而且 
是一个连续时间的随机过程，且满足 

da ： i< = ^,(*<)(1/, i = 1 , ••- , k , (6.21) 

其中 1 / 4 是一个维纳过程.可以理解为漂移函数与波动率函数 cn ( x tt ) 也是 
时间指数 < 的函数.为了简化记号，我们将 f 从变量屮省略.对 M j ，维纳过程_ 
和是不一样的.我们假定 ch ^ 与 clw jt 的相关系数是 p i 7 , 这意味着/^是定义 
为△抑 = e ,_ A /. 和= ejAt 的两个标准 it 态随机变量&和~问的相关系数. 


m G-G 股市波 动隼与 敲定价格对宥涨期权的联合效应，其中 /) = 80, r - / = 0.25, r = 0.06 
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因此 

•t 1 

W a dw B = ~(wf - t). 
Jo Z 

这不同于通常的确定积分，那里 

[ydy = ( y ? - Vo )/ 2 - 
Jo 

转到:是一个几何布朗运动的情况，即 A 满足 


dxf = H- axt^wt. 


其中芦 ， a 是常数， a > 0,见方程 （6.8) .对 G ( x t , t ) = ln ( x t ) 利用伊藤引理，我们得 



dln(xi) 




<r 


) 


dt + ( idwt ， 


取积分，并利用前面得到的结果，我们有 


因此 


dln ( x 8 ) — 

0 



4 pt 

els + cr dw a . 

o Jo 


ln ( x t ) — in ( xo ) + (/x — cr 2 /2 )t + < rwt , 


且 


x t = xo expf(/i - a 2 /2)t. + (rw t ]. 

刘资产价格将记号 A 改为巧，则我们在假设价格服从一个几何布朗运动 N ， 对价 
格有一个解.此价格为 


Pt = Pq exp[(/x — a 2 /2 )t + cr «; t ]. (6.25) 

6.9 跳跃扩散模型 

经验研究发现，基于布朗运动的随机扩散模型不能解释资产收益率及其衍生 
资产价格的一些特征（例如，隐含波动率的“波动率微笑”，见 Bakshi ， Cao 和 Chen 
(1997) 及其里面的参考文献).波动举微笑指的是期权的隐含波动牟为敲定价格的 
—个凸凼数.赔钱和赚钱的期权都倾向于比不赔不赚的期权有吏高的隐含波动率. 
尤其在外汇市场中.证券期权对波动率微笑的重视较少.标准随机扩散模型的不足 
导致了其他连续时间模型的创建.例如.许多文献已提出跳跃扩散及随机波动率模 
型来克服这种不足；见 Merton (1976) 和 Duffie (1995). 
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股价的跳跃经常假定为服从一个概率法则.例如，跳跃可能服从一个泊松过程， 
它是一个连续时间的离散过程.对于给定的时刻令&表示在时间段 [ Oj 上一 
个特定事件发生的次数.如果 


Pr ( X t = m ) =- r - oxp (- Af ), A > 0, 

m ! 

则 AT , 就是一个泊松过程.也就是说， X ,服从一个参数为 A / 的泊松分布.参数 A 控 
制了特定事件的发生，称之为过程的强度.正式的定义还要求 X ,是一个带有左极 
限且右连续的齐次马尔可夫过程. 

本节讨论了 Ktm (2002) 提出的一个简单的跳跃扩散模型.这个简单模型有几 
个好的性质.模型隐含的收益率是有尖峰的、关于0点非对称的.此外，模型可以 
再生波动率微笑并对许多期权的价格提供解析公式.模型包括两部分，第部分是 
连续的，服从个几何布朗 运动； 第二部分是一个跳跃过程.跳跃的产生由一个泊 
松过程控制，并且跳跃的大小服从一个双指数分布•令尸，表示资产在/ N 刻的价 
格，简单的跳跃扩散模型假定价格服从随机微分方程 

^ = ndt + <rdw t + d {Ji - 1)^ , (6.26) 

其中叫是一个维纳过程 • m 是强度为 A 的泊松过程，{，}是独立同分布的非负随 
机变量序列，满足 X = ln(J) 服从双重指数分布，而且概率密度函数为 

Ix(x) = 0 < r; < 1. (6.27) 

双重指数分布又称为 Laplacian 分布.在模型 （6.26) 屮， n t ， 叫和是相互独立的, 
以至模型的随机性之间没有关系，注意到 n t 是时间间隔 [0 J 上发生跳跃的次数. 
并服从参数为 A / 的泊松 分布. 其中 A 是一个常数.在第；次跳跃中，价格跳跃的比 
例为 A - 1. 

双指数分布可写为 


v / 以概率 ().5, 

\ - c , 以概率0.5， 

其中€是均值为方差为；7 2 的指数随机变量 .（ 的概率密度函数为 

J(x) = ie— 0 < x < oo. 

V 

双指数分布的一些有用性质为 

E(X)-k, Var(X) - 2 V \ E(e x ) = 

\ — TT 


(6.28) 
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对于有限样本.很难区别双指数分布与 < 分布.然而，双指数分布在解析上更易于处 
理.并且可以产生一个在均值周围的更高的概率集中度（例如更高峰).正如第〗章 
所述的，观测到的收益率的直方图倾向于比正态密度有更高的峰.图 6-8 用实线表 
示了双指数随机变最的概率密度函数，虚线是一个正态随机变量的概率密度函数. 
两个变量的均值都是()、方差为 n.non 8. 从阁 6-8 中可以很清楚看到双指数密度的 
高峰. 

25 
20 
15 
衡 1 U 


0 

-0*2 -0.1 0.0 0.1 0.2 

X 

图& *8 均值为0,方差为0 000 8的双指数随机变量和正态随机变量的概率密度函数. 
实线是双指数分布 

解方程 (6.26) 的随机微分方程，我们得到资产价格的动态规律 

Pt = Pq exp[(// - o ’） I2 、 t ■十 CTW t in* 7 - (6.29) 

i=l 

这里可以理解为 = 1. 这个结果是方程 (6.25) 包含随机跳跃时的一般化.可以 

如下得到.令 i 次跳跃的时间.对于/ € [0,^), 没有跳跃而且价格可以由 
方程 (6.25) 给出.因此，左面价格在时刻“时的极限为 

P t 、 = Pq exp[(/i - a 2 /2)t x -f crw tl \. 

在时刻 L 价格跳跃的比例为 A - 1，使得价格变为 

Pt 、 = (1 + -A - 1)' = J\P l{ = Pn exp[(/x - cr 2 /2)ti + 

对于 < e 区间 {t u t] 上没有跳跃.所以 

Pt = Pt, exp[(" - a 2 /2)(t - Zi) + er(wt - uv,)]. 

代入我们有 

Pt = -Po expf(// - (T 2 /2)t 4 - 
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重复这个方案，可得到方程 ( G .29). 

由方程（6.29)，标的资产在一个小的时间增量上的简单收益率为 


Pt+At — P ， 
Pi 


exp 


〆 —j — tut) -f X, 

‘=n 霍 +1 


这里可以理 解为. 一个空集上的和为0,且；^ = 1 x 1(./,). 对子一个小△<，我们可以 
利用近似 \ x \ X 2 12' 以及 6.3 节讨论的结果 (Aw t ) 2 « 得到 

~^^p t ~^ » (P - ;a 2 ) Ai + + ^2 不十臺汀 2 (Awt) 2 

\ / «= n t I 1 

w 霧十 At 

w fiAt + uey/At. 4- ^ 

<=nt + l 


其中 △(/；(! = Wt+At-Wt, &e 是一个标准正态随机变量. 

在泊松过程的假设下，在时间间隔 ( f ,t + At ] 上有一个跳跃的概率为 AA /.， 且 
多于一个跳跃的概率为 o ( At ), 其中 o ( At ) 意指： 如果我们将这一项用 Af 来除，则 
当 At 趋于0时.它的值也趋子 0. 因此，对一个小的△<，忽略掉多个跳跃，我们有 

X - i Xn ^ u 以概率 A △亡， 

卜 1 〜1 0, 以概率1 — Wt . 


与前 till 的结果相结合.可以看出标的资产的简单收益率的近似分布可由下式给出 

P 一 p _ 

- 卜 p -- « //△' 十 (T£\fKt 十 / x JV , (6.30) 

其中/是伯努利随机变量，且 Pr(/ = 1) = XAt , Pr (/ = 0) = 1 - XAt ; X 是方程 
(0.28) 中定义的双指数随机变量. X 跳跃时方程 (6.30) 简化力一个几何布朗运动. 

令 G = + aey/At + / x X 表示方程 (6.3 U ) 右面的随机变量.利用模型中 

用到的指数分介与正态分布的独立性 ， Kou (2002) 得到/ G 的概率密度函数为 

g{x) = …/( 軔 3 ) { e (wrj-a 2 At\ + f 1 

2’" l V (TT)\/At J V rTTfsfKt.)) 


+ (1 - AA/.) 




( G .31) 


其中 w; = i ； - fiAt - k, 并且 /(.) 和中 ㈠ 分别是标准正态随机变量的概率密度函数 
和累积分布函数.另外， 

E(G) = nAt + K\At y Var(G , ) = a 2 At + XAt[2r] 2 + « 2 (1 - AA*)]. 
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图 6-9 显示了正态分布与方程 (6.31) 的分布的概率密度函数的一些比较.两个分 
布的均值都是（)、方差都是 2.057 2 x 1() 4 . 均值和方差是通过假定标的资产的年 
收益率满足 p = 20%, cr = 20%， △/ - 1 天-1/252年 ， A = 1(], h = -0.02, t / = ().02 
而得到的.换句话说，我们假定毎年大约有 1() 天跳跃，〒均跳跃大小为-2%.跳跃 
波动率为2%.这些值对美国股票是合理的.从图中，可以清楚地看到由方程 （6.2( i ) 
的跳跃扩散过程推导出的分布的尖峰态性质.该分布比相应的正态分布有更髙的 
峰和更厚的尾巴. 


(«) 密皮函数 


( C ) 左尾比较 



( I .)尖峰比较 




图 64) 正态分布和方程 (6.31) 分布的密度 比较. 点线表示 n ： 态分布_两个分布的均值都是 （), 
方差都是 2.057 2 x 10 4 . ( a ) 整体 比较； （ b ) 央峰的 比较； （ c ) 左尾； （ d ) 右尾 


跳跃扩散下的期权定价 

当随机跳跃出现时，市场将变成不完全的.在这种情况下，标准套期变量对期 
权定价就不再适 用了. 但我们仍可以推导出不依赖于对风险的态度的期权定价公 
式.方法是假定可利用的证券数量非常大，以至于突然跳跃的风险是可以分散的， 
并且市场因此对超过无风险利率的部分承担风险时将不支付风险溢价.换句话说. 
对于风险溢价的一个给定集合，可以考虑风险中性测度满足 

-75T = [ r — — l)]df ] crdwt I d 

尸 f 

=(r - Xxl))dt + adw t + d ^ (Jj — 1), 

- 

其中 r 是无风险利率.•/ = exp ( X ) 满足 X 服从方程 （6.27) 的双指数分布，？/;= 
c w /(l - t ; 2 ) - 1, 0 < 7 , < 1. 考虑风险溢价时.参数&必和 a 变成了风险中件参 


XI ( •人 - ” 

t=l 
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数.具体可参见 Ko « (2002). 前面方程的唯一解为 


n /‘. 

t=i 

为了对跳跃扩散模型中的一个欧式期权定价.剩下的就是计算期权折现的最终回报 
在测度 p * 下的期望.具体来讲，一个欧式看涨期权在 < 时刻的价格可以由下式给 
山 


Pi — P() GXp 


< T * 


- y - ) t 4 - crw t 


c t = E*[e -r( T-*)(/V _ /()+] 


E. 


e ^ r(T '^ ( Pt exp 


r 


一灯 2 \ _1 n T 

—(T - t) + <rs/T^t£ 

, J *-=1 


.(6.32) 


其中 r 是到期日， (T-0 是用年测量的离到期日的时间， A ： 是执行价格， ( y ) + - 
max (0, y )， e 是标准正态随机变量. Kou (2002) 证明了 q 在解析上是可以处理的，因 
为 


-MT-t^ n (T-tr v 
n ! 2 2n ~ 


C « = EE C 

n-1j-1 
X (乂 l，”，j + + ^3, h ,./) 


2 n - •』 
n — 1 


(6.33) 


+ e ~ x ^ T ~ i ) [ P t e ~ k ^ r ~ i ) ^{ h + ) — A * e _ r ( T _ t ) $(/ i _)], 


其中以是标准正态随机变量的累积分布函数， 


^. n ,3 

^2.h,j 


P,e 


一 At/, (7’ 一 （）+un 


2 


(丄一价 U+") J J 


$(&+) - e - r ( r _ l ) ^(6_). 


2 

• 1 r ^ ( aVT ^ 


X 




=0 


a 3 . 


n,] 


L ( i -"))-*• j \ n 

e -r(T-tHw/v+^[T-t)/[2r ) 3 ) K 

( ay / T^tV 


y 去释 


2 

J 一 1 

xE 

»^=0 


(1 十沖 


V 


:) 


\/2 i \ 


Hh t ( c ^), 


h ± 

c 士 


la + (r 土 a 2 (2 - Xip){T t ) + hk 
gs / T^V 

\ n { P ,/ K ) + ( r ± 0^/2- A ^)( T - i ) 


aVT ^ 

V 


士 


ay/T — t 
w 

ay [ T~~t 
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«/ = \ w{K / Pt ) + — t ) — (r — < r ^/2 )(T — t ) — tik , 

e K 




1 — T} 2 


-1， 


而函数 Hh ,(.) 定义为 


Hh ,( x ) 




— ar ) n R -8 ^^ 2 fl.<j n = 0,1, 


( G .34) 


且有 HUj :) = ex P (-. r 2 /2) .当 f ( x ) 是一个正态随机变量的累积分布函数时，它 
就是 y /2 nf ( x ). 详见 Ahmmowit . z 和 Stegun (1972). 函数 Hh n ( x ) 满足下面的递推 
公式 

nHh n (x) - ffh n _ 2 (x)- j.7//t n _i(x), u 1, (6.35) 

初始值为 ffh — i ( x ) = e _ * 3 / 2 , 且 Hho(x) = v /27 r ^(— x ). 

定价公式涉及一个无穷序列，但是它的数值可以通过截断 ( trm « ration )(^ tJin , 
前10项）快速而精确地 逼近. 如果 A = 0( 即没有跳跃)，则很容易看到对子前面讨 
论的看涨期权而言， G 简化为 B ~ S 公式. 

最后，考虑跳跃扩散模型的条件下，一个欧式看跌期权的价格可以通过涨-跌 
平价得到，即 

灼=十 ^ e -r(T-0 _ 

在方程 （6.2 G ) 的跳跃扩散模型下的其他期权定价公式可以参见 Kou (2002). 

例 6 . 8 考虑例 6.6 中的股票，当前价格为 $80. 如前，假定欧式期权的敲定价格 
为= $ S 5, 且其他参数为 r = 0.08, T-t = ().25. 另外，假设股价服从方程 (6.26) 
中的跳跃扩散模型.参数为 A = 】 0, k . = -0.02, /, = 0.02. 换句话说，每年大约有 
10个跳跃，平均跳跃大小为- 2 %旦跳跃波动宇为2%.利用方程 (6.33) 中的公式1 
我们得到 r , = 3.92,当没有跳跃时高于例 6.6 中的 $3.49. 相应的看跌期权假定为 
1 h - $3.31, 也比我们以前的高 很多. 正如所期望的，当保持其余参数不变，加入跳 
跃时就增加了两种欧式期权的 价格.然而， 请注意， 实呸应 用时.在股价屮加入跳跃 
过程经常导致股票波动率 a 的不同估计. 


6.10 连续时间模型的估计 

下面我们考虑直接从离散样本数据中估计扩散方程（即伊藤 过程） 的问题.这 
里漂移函数 fi ( x ,, t ) 和波动率函数 a { x u t ) 都是时 变的. 并可能不服从一个具体的 
参数 形式. 这是近年来引起人们很大兴趣的一个主题.具体方法的细节超出了本章 
的范围.因此我们仅对文献中提出的方法简要介绍一下.有兴趣的读者可以査阅相 
应的文献以及 Lu (1988). 
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估计一个扩散方程时有几种可以利用的方法.第一种方法是拟最大似然方法， 
它利用了 du ,, 在一个很小的时间间隔上是正态分布的 事实. 参见 Kessler (1的7)及 
其参考文献第二种方法是矩方法.参见 Conley, Hansen, Luttmer 和 Scheinkman 
(1997) 及其参考文献第 7 种方法是利用非参数 方法. 参见 Ait-Sahalia (1996, 
2002). 第四种方法是利用半参数方法和再投影 （ rpprnjert.ion) 方法.参见 Gallant 
和 Long (1007), Gallant 和 Tauchen (1997). 最近，许多研究者已经开始利用 MCMC 
方法来估计扩散方程 • 具体可参见 Eraker (2001) 以及 Elerian. Chib 和 Shephard 
(2001). 


附录 A B - S 公式积分 

本附录将推导出方程 (6.19) 给出的欧式看涨期权的 价格. 令 * = HPt ), 利用 
变量代换以及 9{Pt)^Pt = f{x)dx. 其中 f(x) 为 x 的概率密度函数，我们有 


Ct 


= exp [— r(T* — 亡 )] 
»oo 

= e -r(T-t) 

* 


(iV - f^)g{Pr)^pT 

• K 

( e x - K ) f ( x)dx 




»oc 

•oo 

e -r(T-t) 


c x f{x)dx - K 

f(x)dx 


: 

in(,K) • 

\n(K) 


(6.36) 


因为 z = In ( Fr ) - ArpnCPt ) 十 （ r - a 2 /2)( T - - L )}, 所以方程 (6.36) 中第二 

项的积分简化为 


» 

. 1 


ln(K) 


f(s)dx 


「 | n (/C) 

f(x)dx 
oo 

cdf(ln ⑹） 
€►(-*_) = *(/»_), 


其中 cdf ( ln ( A *)) 为 x = ln ( Pr ) 的累积分布函数在寧)处的取值，外)是标准正 
态随机变量的累积分布函数，而且 

lu(A') - In(A) - (r - a 2 /2)(T - t) 

一 h 一二 - ，- - 

<t\/T t 

-ln(P t /K) - (r - 0^/2)^ - t) 
a\jT — t 


方程 (6.36) 中第一项的枳分叫以写为 


*00 

t — exp 
Jin(fO \f2iis/aV^T — t) 


[ x -\n(P t )-(r-a 2 /2)(T-t)} 2 

2a 2 (T-t) 


cL /:， 




其中指数可以简化为 


x-\n{Pt)-{r-a 2 /2){T-t)\ 2 

2(7 2 (T-t.) 

卜 {ln(P,) + (r + a 2 /2)(T-/.)}] 2 


2a 2 (T - t) 


In ⑹ + r ( r - 幻, 


因此，第一个积分变为 


lln (. K ) 


a T f ( x)dx 


= P^ T -^ T 1 削 |x-{ln(P t ) + (r + a 2 /2)(T-t)}] 2 1 . 

Jln ( K ") y /2 TTyy ( X 2 (T — t ) 2( T 2 {T - t ) ■ X ， 

它包含了一个均值为 + + 方差为 cr 2 (T t ) 的正态分布的累 

积分布 函数. 利用前面证明第二个积分的同样方法.我们有 


IlnlK ") 


e 2 f{x)dx = P t e r(T 


其中" + 由卜式给出 


,_ \n(P t /K) + {r + a 2 /2)(T-t) 

* 


将两个结果结合，我们就有 

Q- e-^ r -«[P t e r ^- < ^(/ l+ ) - K4>(Ai_)] = P t ^(h + ) - A ， e_ r ( r -M(/L). 

附录 B 标准正态概率的近似 

—个标准正态随机变量的累积分布函数 cdM >(； r ) 可以近似为 


中 | 1 ~ /(^)[cifc + c 2 k 2 + c 3 fc 3 + c 4 k 4 + c 5 A: 5 ], 若 t 彡 0 ， 

1 1 - 蚵 一 X )， 若 a ： < 0. 

其中 /(x) = exp(-x 2 /2)/s/2^,k = 1/(1 + 0.231 641 9.r), c x = 0.319 381 530, c 2 = 
-0.356 563 782 , c 3 = 1.781 477 937, c 4 = —1.821 255 978, c 5 = 1.330 274 429. 

例如，利用前面的近似，我们得到4>(1.96) = 0.975 002,企 (0.82) = ().793 892, 
中(_0.61)二 0.270 931. 这些概率与个典型的正态概率表中得到的值非常接近. 


练习题 

fi -1 假定对数价格 P , = ln ( Pe ) 服从一个随机微分方程 


dpt = 7(1广 + crdwt , 

其中奶是一个维纳过程.试推导价格 p , 的随机方程. 
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6.2 考虑一个不支付红利的股票的远期价格 F , 我们有 

Fi,t = PtB r(T - l \ 

其中 r 是无风险利率，它是 常数； 行是当前的股价.假设 H 服从几何布朗运动 

dPt — fiPtdt + crPtdwt. 

试推异 F t . r 的随机微分 方程. 

6.3 假定 IBM 股票的价格服从伊藤过程 

dFf = + aHtdwt , 

其中 / i 和 a 都是固定的 ，阶 是一个标准的布朗 运动. 考虑 IBM 股票在 19 U 7 年的日对数 
收益率.平均收益率与样本的标准差分别为 0.001 31和0.() 2 ‘2 15. 假设1997年有252个 
交易曰，运用此数据来估计参数 M 和& 

6.4 假设一只股票的当前价格是每股1‘2()美元，年波动率=50%.进一步假定年无风险利率 
为7%, E 该股票不支付红利 .（ a ) 这只股票的敲定价格为 S 125 且到期时间为3个月的欧 
式看涨期权的价格是多少？ （ b ) 这只股票的敲定价格为$ 118且到期时间为3个月的欧式 
符跌期权的价格是多少？如来年波动率增加到80%,那么两种期权的价格分别是多少呢？ 
6.5 推导一只股票的欧式看跌期权中5个变量 K 、 f J t ' T - t 、 cr 及 r 的极限边际效应. 

H .6 股票当前的价格为每股⑹美元，并 a 服从几何布朗运动 

dPt = liPtdt 4 - aPtdt. 

假设该股票的年期望收益字为 / i ， 年波 动字为 40%,问股价在两年内的概率分布是什么？ 
试求该分布的均值和标准差，并 H 对此股价构诰一个95%的置信区间. 

6.7 当前股价为毎股60美元.并服从几何布朗运动 

dPt = /i 尸 fcU 十 aPtdt. 

假设该股票的年期望收益半.为 / i . 年波动率为40%.问股票两年的连续复合收益率的概率 
分布是什么？试求此分布的均值和标准差. 

6.8 假设股票 A 的当前价格是每股70美元，此价格服从方程 (6.26) 的跳跃扩散 模型. 假定 
年无风险利率为8%,股票不分红，年波动率为30%.另外，价格平均每年大约有15个跳 
跃，平均的跳跃大小为-2%,跳跃波动率为3%.问敲定价格为$75 li 到期时间为3个月 
的一个欧式看涨期权的价格是多少？相应的欧式宥跌期权的价格是多少？ 

B.9 考虑没有分红支付的股票的欧式看涨期权.假定= S20, K = $18. 年利率为 r = 6%, 
r - f = 0.5 年.如果股栗的欧式看涨期权的价格是 $2.10, 套利者有套利的机会吗？ 

6.10 考虑没有分红支付的股槊的欧式看跌 期权. 假定= $44, 尺 =$47, 年利举为 r = 6%, 
T « = 0.5 年.如果股票的欧式宥跌期权的价格是 $1.00, 奁利者有套利的机会吗？ 
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图 7-1 1962年7月3日至1998年12月31日 IBM 股票日对数收益率的时间图 

7.1 风险值 

佥融市场中有几种类型的风险，其中三个主要类别的金融风险是信用风险、流 


第7章极值理论、分位数估计与风险值 

在金融市场中极端的价格运动虽然少见，但很 重要. 1洲7年10月华尔街股市的 
崩盘以及其他大的金融危机（例如长期资本管理 ， Long Term Capital Management ) 
已经引起了实际应用者和研究者们的广泛关注.一些人甚至呼吁政府加强对衍生证 
券市场的监管.近年来，高科技股表面上很大的日价格变动进一步产生了关于市场 
风险以及金融机构保证金设置的 讨论. 因此，风险值 (Value at Risk , 简记为 VaR ) 成 
为在风险管理中广泛使用的市场风险的度量标准. 

本章主要讨论计算 VaR 的各种方法以及这些方法后面的统计 理论. 特别地，我 
们考虑在统计文献中发展起来的极值理论来研究稀少（或异常）事件及其对 VaR 
的应用.其中极值理论的条件概念与无条件概念都在讨论 之列. 金融头寸 VaR 计 
算的无条件方法需要用到计箅 VaR 所涉及的金融工具的历史收益率.然而 • 条件方 
法则运用历史数据弓解释变量来计算 VaR . 

本章讨论的其他汁算 VaR 的方法是风险度量制 ( RiskMetrics ), 波动率模型的 
经济 II 量模型以及经验分位数.我们利用 IDM 股票的日对数收益率来解释所有所 
讨论方法的实际计算.囚此，得到的结果可以用來比较不同方法的表现•图 7-1 描 
述了 IBM 股票从1962年7月3日至1998年 I 2 月31日的日对数收益率，共 
9 190个观测值的时间图. 
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动性风险以及市场风险 . VaR 主要讨论市场风险，但是它也可以应用于其他类型 
的风险 . VaR 是在某个风险范畴中的机构的头寸在一个给定持有期间内可能会由 
于一般的市场运动而降低所带来的损失的统一估计.对 VaR 的一般阐述.可参见 
Duffie 和 Pan (1997) 以及 .hmou (1997). 金融机构可以利用这一尺度来评估他们的 
风险，或者通过一个管理委员会设定边际要求.在其他情形，可以用 VaR 来确保金 
融机构经过一个灾难性事件之后仍然可以运转.从金融机构的角度， VaR 可以定义 
为金融头寸在一个给定时间段上，以某个给定的概率发生的最大损失.以这种观点， 
可以将 VaR 看作是在正常市场条件下与稀少（异常）事件相联系的损失的一个度 
量.换句话说.从管理委员会的角度， VaR 可以定义为在异常市场情境下的最小损 
失.两种定义尽管概念上貌似相差很远.但都将导致同样的 VaR 度量. 

下面.我们在概率框架下定义 VaR . 假设在时间指标 f 点，我们感兴趣的是接 
下来的/段中一个金融头寸的风险■令 AK (/) 表示金融头寸中，从时刻 （ 到时刻 
t + l N 资产价值的变化.这个数量用美元度量.且在时间指标为/时是一个随机变 
量.用 F ,( x ) 表示 AV(l) 的累积分布函数 （ cdf ). 定义一个多头头寸在持有期/中 
概率为 p 的 VaR 为 

P = Pr [ AK (/) ^ VaR ] = F ,( VaR ). (7.1) 

因为当 AK (/) < 0 时，一个多头金融头寸的持有者遭受损失，所以当 p 很小时，方 
程 (7.1) 中定义的 VaR 是一个负值,其中负号表示一个损失.由定义，在时间区间/ 
上.持有者将要遭受的损失大于或等于 VaR 的概率 p . 换一种说法, VaR 可以解释 
如下： 以概率 1 - p , 金融头寸的持有者在时间区间/上遭受的潜在损失小于或等 
于 VaR . 

当资产价倌增加[即⑴ > 0 ] 时.空头头寸的持有者遭受损失,这时 VaR 定 

义为 

p = Pr [ A \/(/) ^ VaR ] = 1 - Pr [ AK (/) VaR ] = 1 - F ,( VaR ). 

对于一个小 p , 空义义寸的 VaR 为一个正值.其中正号表示个损失. 

前面的定义显示 VaR 关注的是累积分布函数 F t (x) 的尾部行为.对一个多头 
头寸， F,(x) 的左尾很重要，然而刈空头头寸则主要关注于 F t (x) 的右尾.注意到如 
果利用 -AV(l) 的 分布.则方程 （7.1) 中 VaU 的定义也可以应用于空头头寸.因此， 
仅利用多头头寸米讨论 VaH 计算的方法就足够 

对任何一兀的累积分布函数 Fi(x) 与概率 p (0 < p < 1 ), 称 

x P = inf{a?|F,(x) > p) 

为的 p - 分位数.其中 itif 表示满足 Fi(x) ^ p 的最小实数.如果已知方程 
(7.1) 中的累积分布函数 F /(； r ), 则 VaR 就是它的 p - 分位数（即 VaR = 4 ). 然而 
实际中 cdf 是未知的，从而对 VaR 的研究主要关心的是 cdf 及其分位数的估计，尤 
其是 cdf 的尾部性质. 
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在实际应用中， VaR 的计算涉及如下几个因素. 

(1) 感兴趣的概率 p , 例如 p = 0.01 或 p = 0.05. 

(2) 时间区间它可由管理委员会设定，例如1天或 in 天. 

(3) 数据频率.它可能与时间区间/不一样且经常使用日观测值. 

(4) 累积分布函数 F ^ x ) 或它的分位数. 

(5) 金融头寸的数 董或若 证券组合的盯市价值 ( market - to-market value ). 

在这些因素中，累积分布函数 F ^ x ) 是经济计量模型的焦点，累积分布函数估计的 
不同方法引起了 VaR 计算的不同方法. 

注释1: 方程 (7.1) 中的 VnR 定义足用美元度 量的. 因为对数收益率近似等 

于金融头寸价值的百分比变化，所以在教据分忻中我们使用的是对教收益率 r t •给 
定 f 时刻已知信息的条件 F . 由 r t +1 分布的分位数计算的 VaR 用百分比表示.因 
此 Valt 的美元计量为金融头寸的现金值乘以对数收益率序列的 VaK . 即 VaH =现 
金值 X 对数收益率的 VaR . 必要的时候，可以使用近似 VnR =现金值 x [ exp (对数 
收益率的 VaR )— lj . □ 

注释2: VaR 关注的是组合在给定时间区间上的可能损失的一个预测.可以 

利用金融头寸未来收益率的预測分布来计算.例如.使用日收益率 r , 且组合在1天 
持有期的 VaR 可以利用 r t + l 在给定/时刻已知信息下的预测分布来计算.由统计 
的观点 ， 在一个恰当指定的模型中.预测分布考虑了参数的不确 定性. 然而，预测分 
布很难得到，并且大多数 VaR 计算可以利用的方法都忽视了参数不确定性的影响. 

□ 

7.2 风险度量制 

. I . P . Morgan 将风险度量制方法发展到了 VaR 计算中.详见 Longerstaey 和 
More (1995). 风险度量制的简单形式假定组合的连续复合 F 1 收益率服从一个条件 
正态分布.用 n 表示日对数收益宇表示 * - 〗时刻可以得到的信息集合.风 
险度量制假定 r t | F , i ~ 其中叫是 r t 的条件均值 . #是的条件方差. 

另外，这个方法假定这两个量是随时间变化的，对应于简单的 模型： 

/々=()，+ (1 - 咖?—" 0 < a < 1. (7.2) 

因此，此方法假定组合的日价格的对数 p , = ln ( P t ) 满足差分方程川-内 -i =〜，其 
中 a , = 是一个无漂移的 IGARCH (],1) 过程 . u 的值通常取在区间（0.9, 1) 上， 

其中一个代表值为 0.94. 

这样一个特殊的随机游动 IGARCH 模型的良好性 质是： 利用它很容易得到一 
个多期收益率的条件分布.具体来讲，对 A : 个周期的持有期，从时刻 t + 1到时刻 
t + fc (包含 t + A ; 时刻）的对数收益率为 r , ㈨ = 77 +1 +... + rt + fc _ 1 + r t + Jk . 方括号 ㈨ 
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表示 k 期收 益率. 在方程 (7.2) 中具体的 IGARCH (1,1) 模型下，条件分布 r 4 A : J | F , 
是均值为0、方差为的正态分布.其中 a t 2 [ fc ] 可以利用第3章讨沦的预测方 
法汁算.由^的独立性假定和模型 (7.2), 我们有 

k 

咖] = Var ( r t [寧 t ) = ^ Var ( a <+ i | F ,), 

t=l 

其中 Var ( a t + l | F t ) = E ( of + i | F t ) 可以递推得到.利用= ( 7 ^^, 我们 
可以将方程 （7.2) 屮 IGARCH (1,1) 模型的波动率力程改写为 

n t — + (1 — - 1)，对所有的 <. 

特别地，我们有 

— a t + i - 1 + (1 - — 1 )， i = 2, ••- , k . 

因为对 i 彡2, - 1| F ,) = 0, 所以前面的方程说明 

= l ^)> i = 2, • •. ， A :. (7.3) 

对向前1步的波动率预测，由方程 （7/2) 知 of +1 = a <7 f + (1 a ) r ； 2 . 因此.方 

程 （7.3) 证明了对 i > 1. Var ( r t + i | F f ) = 从而 af [ k ] = fcof +1 . 结果说明 

M 咄巧〜 卵，^ fi )， 因此，在方程 (7.2) 的这个特殊的 IGARCH (1，1) 模型下， 
r , [ k ] 的条件方差与时间段 （ 成比例 . A 持有期对数收益率的条件标准差为 s / kcr ,^. 

假定金融头寸是一个多头头寸，以致当有一个人的价格下降（即一个大的负收 
益率）时损失发生.如果设定概率为5%，则风险度量制是用 l . tiba t+l 来度量证券 
组合风险，即它利用均值为 U , 标准差为 a t +1 的止态分布的单侧5%分位数.真实 
的 S % 分位数是 - l . 6 5 a t +1 , 但是忽略丁负号，并理解为它代表一个损失.因此，如果 
标准差是用白分比度量的.则风险度量制下证券组合的日 VaR . 为 

VhR =头寸数量 x 1.65< r t + i r 

k 天持有期的 VaR 为 

VaR ( A :) =头寸数量 x 1.65\/ fccr t + i , 

其中 VaR 的变量（岣用来表示时间段.因此，在风险度蛩制下，我们有 

VaR ( Ar ) = Vk x VaR , 

并称之为风险度量制下 VaR 计算 的时间平方根 法则. 

例 7.1 1997年德国马克/美元的汇率的连续复合日收益宇的样木标准差大约是 

0 53%.假定一个投资者长期持有价值〗千万美元的4克/美元汇率合约，则该投资 
者1天持有期的 5% VaR 是 
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10 000 ()00 x (1.65 x 0.005 3) 美元= 87 450美元 • 


相应的1个月持有期 （30 天）的 VaR 

10 000 000 x ( v /30 x 1.65 x 0.005 3) 美元》478 983美元. 


例 7.2 考虑图 7-1 中 IBM 的 tl 对数收益率.正如第1章中提到的，收益率的样 
本均值显著地不同于 （). 然而，为了说明利用风险度量制的 VaR 计算，我们假定这 
个样本的条件均值为【】，而且收益率的波动率服从一个无漂移的 IGARCH (1，1) 模 
型.拟合的模型为 

r t — a t , a t — af — 0.939 6 trf . ( + (1 — 0.939 6)«^_ j , (7.4) 

其中是标准的高斯白噪声序列.如所料想的，由 Q 统计量， 拒绝/ ■这个模型. 
例如，对于标准残差的平方，我们有一个高度显著的统计量 Q (10) = 56.19. 

由数据与拟合的模型.我们有 r 919( , = -0.012 8, a| 190 = 0.000 347 2. 因此，一 
步向前波动率预测为碎 19() (1) = 0.000 336. 条件分布 r 9191 |F 9190 的 5% 分位数为 
-1.65 x v/0.000 336 = -0.030 25, 这里将负号理解为表示损失.因此， 1 f •万美元的 
多头头寸在1天持有期内的 5% VaR 为 

VaR = 10 00() 000 x 0.030 25 美元二 302 500美元. 

1% 分位数是 - 2.32G 2 x v/0.000 336 = -0.042 65, 相应的相同多头头寸的 l%VaR 
为 426 500 美元. 

注释：为了应用 S - Plus 中的风险度量制，我们可以用 mgarch (多元 GARCH ) 
命令下的 ewmal (一阶指教加权滑动平均）来估计1 - tt . 然后用命令 predict 获 
得波动车预测.对于所用的 IBM 數据 . a 的估计是1 -0.036 = 0.964, 波动車的向 
前一步预测是知 190 ( 1 ) = 0.(118 88. 具体参见下而的 演示. 可算得对于 p =： f ). n ； S 和 
P = 0.01. 分别有 VaR - 311 520美元和 VaR . - 439 187美元.这两个 VaR 值要比 
例 7.2 給出的值稍小.例 7.2 是基于 RATS 程序给出的估计. 口 


S - Plus 演示 


输出结果已经简化. 

>ibm.risk=mgarch(ibm 〜 -1 ，〜 ewmal) 

>ibm.risk 

ALPHA 0.036 

>predict(ibm.risk,2) 

$sigma.pred O.Olbbb 


7.2.1 讨论 

风险度量制的一个优点就是简单，很易于理解和运用.另外一个优点是它使得 
金融市场中的风险更加透明了.然而.因为证券收益率常常有厚尾（或肥尾)，所以 
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正态性假定通常导致 VaR 的低估.其他计算 VaR 的方法也要避免作这样一个假 
定. 

时间平方根法则是风险度量制中运用特殊模型的一个结果.如果对数收益率的 
零均值假定或者具休的 IGARCH(l.l) 模型假设不满足，则此准则就失效了.考虑 
下面这个简单 模型： 

r t = // + ti t , at = P _ (】， af = ocaf_ x + (1 — a)af_ x , 

其中休是标准的高斯白噪声序列 P # 0 的假定对许多在 NYSE 中大量交易的 
股票收益率都是成立的（见第1章).对子上面这一简单模型，给定圮下 r t|1 的 
分布服从用来计算 1 天持有期 VaR 的 5% 分位数变为 fj. - 1.65a t+1 . 
对一个 A : 天持有期，给定6下的分布服从 N { kfi , kaj +1 ), 其中同前面一样， 
r t \ k ] = r t+1 + ... 十 rt+fcy 十 r t+k . k 天持有期 VaR 计算中运用的 5% 分位数是 
kit - 1.65 v ^ t + i = \/ k{\/kn - 1.65CT t+ i). 因此，当平均收益率不为 0 时， VaR(A：) ^ 
v/fcx Vali. 同样很容易证明当收益率的波动率模型不是无漂移的 IGARCH(1 ， 1) 模 
型时，此方法也是失效的. 

7.2.2 多个头寸 

在些应用中，投资者可能持有多个头寸，并且需要计算头寸的全部 VaR . 做 
这样一个 il 算时，在假定每个头寸的日对数收益服从个随机游动 IGAHCH ( U ) 
模型下，风险度量制采取了一个简单方法.需要的额外星是收益率间的交叉相关系 
数.考虑两个头寸的情况.令 Vai ^ 和 VaR 2 表示两个头寸的 VaR , 并且令 p 12 表 
示两个收益率间的交叉相关系数，即 P12 = Cov ( ri /, r 2 «)/[ Var ( ri t ) Var (' r2t )] t) n . 则投 
资者的全部 VaR 为 

VaR = y/VaR? + VaR! + 2/> 12 VaRi VaR 3 . 

一个包含 m 个工具的头寸的 VaR —般式 R ) 由 K 式得到： 

mm 

VaR = 21 VaRj + 2^ P * jVaR l VaR Jt 

)i=l i<j 

其中是第 i 个与第 ./ 个工具的收益率间的交叉相关系数， VaR , 表示第 i 个工 
具的 VaR . 

7.3 VaR 计算的计量经济方法 

VaR 计算的一个一般方法就是利用第2章到第4章中时间序列的经济计量模 
型.对于一个长期收益率序列，可以利用第2章中的时间序列模型来对均值方程建 
模，并且可利用第3章或第4章的条件异方差模型来处理波动率.为了简便.我们 
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在讨论中利用 GARCH 模型，并将此方法称为 VaR 计算的计 量经济方法. 也可以 
利用其他的波动率模型（包括第4章中的非线性模型). 

考虑某资产的对数收益率/ V 它的一般时间序列模型可以写为 

V q 

= ^0 + + 0，t — QjCLi-j ， 

»=1 

Of . = a t et , 

u v 

^ = gp + aiaf_ % + E fljfTt-j- 

1=1 J = 1 

方程 （7.5) 到 （7.6) 是 n 的均值和波动率方程.假定参数已知时.可以利用这两个 
方程来得到 n 的条件均值与条件方差的1步向前预测.具体地.我们有 


(7-5) 

(7-6) 


P 

h(i) = </>o + 51 0.^+1-* - 
1=1 


7 

> : 十 l-j 、 



U V 

4(1) = ao -h 

i=l j—^1 

如果进一步假定 e , 是高斯的，则给定/时刻可得信息的条件下， tvh 的条件分布服 
从 AT [ f t ( l ), 矸 (1)]. 用 VaR 计算的这个条件分布的分位数可以很容易得到.例如， 
其5%分位数是 r t ( l ) 1.650-.(1).如果假定是自由度为 r 的标准化的学生分 
布，则分位数为 ft ( l )- t ；,{ p ) d t ( l ), 其中 t ：( p ) 表示自由度为 u 的标准化学生 /：- 分 
布的 />- 分位数. 


自由度为 r 的学生 t - 分布（用 t v 表示）的分位数与它的标准化分布（用/,；；表 
示）的分位数之间有如下 关系： 


P — Pr (4 ^ q ) = Pr 


tv 




q 


\ fv',[v - 2) \f v j{v 




Pr r v ^ 


y / v/(v - 2) 


其中 u > 2 . 也就是说，如果 g 足自由度为 i ; 的学生分布的 p - 分位数.则 
7/ vV (卜 2) 就是自由度为 t ; 的标准化学生〜分布的 p - 分位数.因此，如采力 


程（ 7 .6)的 GARCH 模型中的 q 服从自由度为0的标准化学生分布且概率为 p ， 
则在时刻 t 时，用来计算1天持有期 VaR 的分位数为 

y / v /( v -2) 


其中 t v { p ) 是自由度为 V 的学生 t - 分布的 P - 分位数，这里假定 P 的绝对值很小， 
且 P 为负值. 

例 7.3 再次考虑例 7.2 中 [ BM 的日对数收益率.我们利用两个波动率模型来计 
算一个长期头寸1千万美元在 < = 9 19() 时1天持有期的 VaR . 根据第2章与第 : i 
章中的建模方法.这些计量经济模型是合理的. 





7.3 VaR 计算的计量经济方法 257 


情形1 

假定&是标准正态的.则拟合的模型为 

rj = ().()UU (36 — U.U24 7r，_2 + a <， at = , 

of = 0.00() 003 89 + 0.079 9 a?_ l -( - 0.907 3 a ?. 

由数据，我们有 r 9 i89 = -0.002 ()1, r 9 190 = -0.012 8, fr| lgo = 0.000 334 55. 囚此， 
前面的 AR (2)- GARCH (1,1) 模型产生的 1 步向前预测为 

r 9 i 9 o ( l ) = 0.000 71, < t ^ 100 (1) = 0.00() 321 1. 

5%分位数为 

0.0 U 0 71 - 1.649 9 x VU.UUU 321 1 = - U . U 28 77, 

这里负号理解为表示条件正态分布的左尾.长期头寸1亿美元概率为 0.05 的 VaR 
为 VaR = 10 000 1)00 X 0.0287 7美元= 287 7(1() 美元.结果表明.假定 AH (2)- 
GARCH (1, I ) 模型成立，则以概率95% ; 下一天持有此头寸的潜在损失是287 200 
美元或低于这个值.如果概韦为 0.01, 那么1%分位数为 

0.000 71 - 2.326 2 x v /().()()0 321 1 = -0.040 973 8. 

头寸的 VaK 变为409 738美元. 

情形2 

假定&是自由度为 5 的标准化学生分布.拟合的模型为 
rt = 0.000 3 — 0.033 brt-2 + o . t , a t = o t Et , 

= 0.000 003 + 0. U 55 9 af _, + U .935 

由数据，我们有 r 9 i 89 = -0.002 01, raiflo = -0.012 8, a^ wo = 0.000 349. 因此，前面 
的学生 - fAR (2)- GARCH ( U ) 模型产牛的1步向前预测为 

r 91 g a ( l ) = 0.000 367, ^ 190 (1) = 0.00() 338 6. 

自由度力5的学生 t - 分布的5%分位数为 -2. U 15, 它的标准化分布的5%分 
位数为 -2.015/ >/5/3 = -1.560 8. 因此.给定 F 9l90 条件下， r 919 i 的条件分布的 
5%分位数为 

U . U 00 367 - 1.56() 8>/0.000 338 6 = -0.028 354. 

一个1千万美元的长期头寸的 VaR 为 

VaR = 1() 00() ()0() x G .028 352美元= 283 520美元. 
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这基本上与止态性假定下得到的结果相同.条件分布的1%分位数为 

0.000 367-(3.364 9/ v ^)>/0.000 338 6 - -0.047 504 3. 

对应的 VaR 为475 943美元.与情形1的结果比较，我们可以看出利用自由度为5 
的学生 <• 分布时的厚尾效应，当尾概率变小时增加了 VaR . 在 S - Plus 中，自由度为 
m 的学生 /.- 分布的分位数可以由命令 xp = qt ( p , m ) 得到，例如, xp = qt (0.01,5.23). 

多个周期 

假定在/ I 时刻，我们希望计算对数收益率为的资产的 fc 期 VaR . 感兴趣的 
变童是预测点 h 处的 fc 期对数收益率（即 r h [ k ] = r h+l + -•- + r h+k ). 如果收益率 
r t 服从方程 （7.5) 和 (7.6) 中的时间序列模型，则可以通过第2章和第3章中讨论 
的预测方法来得到 r h \ k ) 在给定信息集下的条件均值与条件方差. 

1. 期望收益率与预测误差 

可以利用第2章中 ARMA 模型的预测方法来得到条件均值 EhMil 凡). 具体 
来讲，我们有 

r / i [ fc ] — rfc ( l ) + . •‘十 rh { k ), 

其中 Ml ) 是收益率在 m 测原点 h 时的/ 步向前预测.这些预测可以利用 2.6.4 节 
讨论的递推方法来计算.利用方程 （7.5) 中 ARMA 模型的 MA 表示 

r , = /i -f a , -f 4 ^ 20(-2 I . •., 

我们可以将预测原点 / l 处的 Z 步向前预测误差定义为 

= a+f - rh { l ) = “ fc+t + tpicih + i-i H - 1- tpi -\ a fl + i . 

可参见方程 (2.33) 以及相应的预测误差 . K 期期望收益率的预测误差是 r , 
在预测原点 / i 处的1步到 it 步向前预测误差的和，可以写为 

=e/j(l) + e/,(2) + …+ eh(k) 

k-i 

= Oh+l + (afc 十 2 + -i - h 

i=l 

— a h\-k + (1 + 分 i)a/i+fc-i + • * • + 咖 ) a/i+ii (7.7) 

其中咖 =1. 

2. 期望波劫車 

k 期收益率在预测原点/，处的波动率预测是在给定下 t h [ k ] 的条件方差. 
利用对 i = 1，… ,k.E t+i 的独立性假定且叫 • = < T t + i et + i , 我们有 
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= Vfc(ah-i-fc) 4- (1 -f V ; i) 2 V/»(a/M-A ： -i) + • * • 4 - 14( 叫十 i) 

= a^{k) + (1 + ) 2 (^h (A: — 1 )-(-••• -f °^(1)’ (7.8) 

其中 V h { z ) 表示给定条件下 2 的条件方差, crl ( l ) 是预测原点/«处的 /- 步向前 
波动率预测如果波动率.模型是方程 (7.6) 中的 GARCH 模型，那么这些波动宇预 
测可以由第3章讨论的方法递推得到. 

作为说明，考虑特殊的时间序列模型 

r t = /i+a t ， a t = fT t £t, 

of = a u 十 o^al；! 十 flia^_ x . 

则对所有的 i > 0, 有也 = 0. k 期收益率在预测原点 /,. 处的点预测为 r h [ Ar ] = 
对应的预测误差为 

= 0 ， h+k + O-h+k-l + ... + O-h+l- 

因此 ，& 期收益率在预测原点^处的波动率预测为 

k 

V A r ( e u [ k }\ F h ) 

利用 3 5 节中 CARCH (1，1) 模型的预测方法，我们有 


^h(!) = «o + «ia? + A 

a hU ) = «o + («i + 0\)(7^(1 — 1), / = 2, • • • , A :. (7.9) 

利用方程 （7.9), 对于也= 0的情况下，我们有当 i > 0时， 


Var ( e /,[ fc ]| Fh ) 


1 - 0*= 
1 — 0 


l-d) k 


4 ⑴. 


(7.10) 


其中 = ai + (3 i < 1. 如果对某个 i > 0有0, # ()，则可以利用 (7.8) 式中 
Var ( e , l [ A ： l | F /l ) 的一般递推公式.如果心是高斯的，则 r h [ k \ 在给定凡下的条件分 
布是均值为 fc / i ， 方差为 VRv ( e h [ k }\ F h ) 的正态分布. VaR 计算中需要的分位数很容 
易 得到. 如果 a , 的条件分布是非髙斯的（比如是学生分布或广义误差分布)，可 
以用模拟的方式得到多期的 VaR . 

例 7.3( 续）对于 TOM 股票的曰对数收益率,考虑例 7.3 中的高斯 AR (2 )-GARCH 
(1,1) 模型. 假定我们感兴趣的是在预测原点9 190( 即1998年12月30日）幵始 

15 

的 I 5 天持有期的 VaR . 我们可以通过给定 F 9l90 T , r 9190 [15] = fr 919a+i ，并 

i=l 
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利用拟合的模型来计算15天对数收益率的条件均值和方差.由方程 （7.9) 递推得 
到条件均值为 0.009 98,条件方差为 0.0 U 4 794 8. 那么条件分布的5%分位数为 
0.009 98 - 1.644 9>/0.004 794 8 = -0.103 919 1. 因此，一个 1 千万美元的多头头寸 
的 15天持有期的 VaR 为 VaR = 10 000 000 x 0.103 919 1 美元= H )39 191 美元 • 
这个数值低于287 700 x vH 美元=丨114 257美元.由这个例子进一步表明，风险 
度量制使用的平方根时间序列法则仅仅对运用特殊的白噪声 IGARCH ( l . l ) 模型成 
立.当条件均倌不为0时，必须采取恰当的步骤计算 A : 持有期的 VaR . 

7.4 分位数估计 


分位数估计提供了 VaR 计算的非参数方法.除了假定该分布在预测阶段仍然 
成立以外，它不对组合的收益率作具体的分布假定 R 前有两种类型的分位数 方法: 
第一种方法是直接利用经验分 位数； 第一种方法是运用分位数回归. 

7.4.1 分位数与次序统计量 

假定收益率的分布在预测期间与样本期间是一样的.可以利用收益率 r t 的经 
验分位数来计算 VaR . 令 n ，…， r n 表示 样本期间内组合的收益率.样本的 次序统 
计晉 是这些倌用递增次序排列后的值.我们利用记号 


^(1) ^ ^(2) ^ ^ ^(n) 


表示这个排列.并将称为样本的第/个次序统计量.特别地 . 表示样本极小 
值，表示样本极大倌. 

假定收益率是独办同分布并有一个连续分布的随机变量，其分布密度函数 (pdf) 
为 /h), cdf 为 F(x). 那么由统计文献（例如 Cox 和 I-Iinkley. 1994,见附录2)，对次 
序统计量其中/ - np , 0 < p < 1. 我们有下面的渐近结果. 

结果令： r p 表示 F (; r ) 的 p 分位数卩 x p = F ~ } ( p )]. 假定分布密度函数 /( z ) 
在处不等 于叫即 f(x p ) ^ 0] ,则次序统计 M r u ) 是渐近正态的，且均值为 x p 、 
方差为 P(1 - p)/[n/ a (x p )]. 也就是说 

〜斗 。 ，黑邊 ]，’ = 叫 (7 . U) 

根据前面的结果，可以利用来估计分位数 o : p ， 这里 Z = np . 实际中.感兴 
趣 的概率 p 可能并不满足 np 是一个正整数.在这种情况下，可以利用简争的插值 
来得到分位数估计.更具体地.对非整数 np , 令/,和表示与 np 最邻近的两个正 
整数，满足6 < 叩< Z 2 . 并定义 P< = li / n . 前面的结果证明了 是分位数: r p ，的 
一个相合估计.由定义， pi < p < p 2 . 因此.分位数可以通过下式 估计： 


⑹十 S 


厂 (D. 


(7.12) 
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例 T. 4 考虑英特尔股票从 1972 年 12 月 15 日至 1997 年 12 月 31 日的日对数收 
益苹，共冇 6 329 个观测值.可以得到数据 5% 的经验分位数为 


io.05 = 0.55r(3i6) + 0.45r (3 i7) = -4.229%, 

这里 up = G 329 X 0.05 = 31(J. 4 5, 且 r(,) 表不样本的笫 i 个次序统计量.在这个特 
例中， r (3 i6) = -4.237%, r (3]7) = -4.220%. 这里我们利用了经验分布的左尾 (lower 
tail), 囚力它在 VaR 的计算中与持有一个多头头寸有关. 

例 7 . 5 再考虑 IBM 股票从 1962 年 7 月 3 日至 1998 年 12 月 31 日的日对数收益 
率.利用全部的 9 190 个观测值，可以得到 5% 的经验分位数为 (r (459) +r (460) )/2 = 
-0.021 603, 其中 r ⑷ 为第 i 个次序统计量，而且 np = 9 190 x 0.05 = 459.5. 1 千万 
美元的多头头寸的 VaR 为 216 030 美元.这远远小于前面用计量方法得到的结果. 
因为样本大小为 9 190, 我们有 91 < 9 190 x 0.01 < 92, 令 Pl = 91/9 190 = 0.009 9, 
P 2 = 92/9 190 = 0.010 01, 则得到 1% 的经验分位数为 


仝 0.01 


P 2 - 0.01 

"^r r(9i) + 


0.01 - p , 

7T^T r(92) 


0.000 01 
— 0.000 11 
«-3.G57. 


(-3.658) + 


0.000 1 
0.000 11 


(-3.657) 


这个多头头寸的 i % 的1天持有期的 VaR 为365 7 ( )9美兀.此值又一次低于了前 
面其他方法得到的结果. 

讨论利用上曲的 VaR 计算的分位数方法有几个优势，包括 （ a ) 简 单性； （ b ) 没有 
具体的分布假定.然而，这个方法也有几个缺点.第一，它假定收益率 n 的分布从 
样本期间到预测期间是保持不变的.并假设 VaR 主要关心的是尾概率，则这个假 
设蕴含了预测的损失不能高于历史的损失，然而实际中并不是这样的.第二，对极 
端分位数（即当 p 接近于0或1时)，经验分位数并非是理论分位数的有效估计.第 
三，直接的分位数估计无法考虑与所研究的组合相关的解释变量的影响.在实际应 
用中，由经验分位数得到的 VaR 可以充当实际 VaR 的一个下界 

7.4.2 分位数回归 

在实际应用中，人们经常能够得到对所研究问题的非常重要的解释变量.例如. 
美国联邦储备银行对利率采取的行动对美国股票的收益率具有重要的 影响 . 从而考 
虑分布函数(这里 F , 包含了这个解释变量）更加恰当.换句话说，我们对给 
定 下的分布函数感兴趣.这样一个分位数在文献中常称之为 回归分位數 . 
具体可以参见 Koeriker 和 Bassett (1978). 

为了理解回归分位数.将前一小节中的经验分位数看作一个估计问题是有益 
的.对于•个给定的概率凡卜,}的 P - 分位数可以通过下式得到 
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i p = argminy^ ii ； p (r, - ( 3 ), 


其中 w p (z) 定义力 

,、 PZy 若 2 > 0, 

Wp(z) = ^ k 斗 

(jp - 1)2 ，若 2 < 0_ 

回归分位数就是这样一个估计的一般化. 

为了看出这种一般化，假定我们有线性回归 

r t = Xt + a t . 


(7.13) 


其屮 (3 是 k 维参数向量，々是预测向垦，这里的预测向量是的元素.因为 
^ x t 是已知的.所以 n 在给定条件下的条件分布 就是叫 的分布的一个平移. 
用此方式看待这个问题， Koeuker 和 Bassett (1978) 指出 r t 在给定 F f _! 条件下的 
条件分位数 x p | F t _! 的估计为 

x p \F t -\ = inf{/3ox|i^,(/3 0 ) = min}, (7.14) 


其中 u R v { I 3 q ) = miu ” 意思是/3 0 可以由下式得到 

n 

00 = arg min ^ w p { r t - ^ Xt ), 

13 t=i 

其中 w p (-) 如前面定义.得到这样一个估计的分位数的计算机程序可以在 Koenker 
和 D’Orey (1987) 中找到. 


7.5 极值理论 

本节将回顾统计文献中的一些极值理论.用 r t 表示某资产以一个给定时间间 
隔（如天）测量的收益率.考虑 n 个收益率的集合 { n ,--- , r n }. 该集合中的最小收 
益率为也就是最小次序统 计量； 而最大收益率 r > o , 也就是最大次序统计量. 
具体来讲，广⑴= min l ^ J < n { rj }, r ( n ) = maxi < j J < ； n { r J }. 闵为对于一个多头头寸而 
言，最小收益率『⑴与 VaR 的计算是高度相关的.所以我们主要讨论 r ⑴的性质_ 
然而，所讨论的理论对该资产在给定时间间隔上的最大收益率也是适用的.因为最 
大收益率的性质可以通过最小收益率的一个简申.的符号变化得到.具体来讲，我们 
有 r ⑻ = — rnini ^ j ^ n { fj } — r 〖 i )， 其中 = —^ t , 上标 c 表不符号的变化 . 最大 

收益率与持有一个空头金融头寸有关. 

7.5.1 极值理论的回顾 

假设收益率 n 是序列独立的，其通常的 cdf 为 F ( x ) 且收益率 r , 的变化范围 
为 [ l , u ]. 对于对数收益率，我们有 Z = - oo , u = oo . r (1) ^ cdf (用 F n , i ( i ) 表示）由 
下式给出 
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F n ,i(x) - rr[r^) ^ x] - 1 - Pr[r(D > x] 

=1 — Pr(ri > x, r 2 > x, ••- , ?- n > x) 

n 

=1 一 Yl Pr ( r i > x ) (由独立性） 

n 

=1 - [1 - Pr(r〆 a;)] 

n 

=1 - U [1 - F(X)] (由通常的分布） 

j=i 

=1 - [1-F(:r)r. (7.15) 

在实际中， r < 的累积密度分布 F(x) 是未知的.因此， r u ) 的累积密度分布 F rtil (. r ) 
也是未知的.然而，当 n 趋于无穷时. F nA (x) 变成退化的.即当 n 趋于无穷时， 
若 x < /，则 F 7 Ii 1 ( x ) 一 0;若 x > [则 F riil ( x ) - 1. 因为这个退化的 cdf 没有实 
际 价值. 所以极值理论关心的是寻找两个序列{^}和 {«„} (其中 a „ > 0)，满足 
r ( i ., = ( r ( I ) -^ t )/« n 的分布当 n 趋子无穷时收敛到一个非退化分布.序列{凡}是 
一 个位置序列， {«„} 是尺度因了序列.在独立性假定下，标准化的最小收益率 
的极限分布为 


尸 •⑷= 


1 — exp[—(1 + A-x) 1/，fc J, 
1 一 exp[-exp(i)], 


若 /r 一 0, 
若 /r = 0. 


(7-10) 


若 k < U , 则上式对 x <~ l / k 成立； 若 A; > 0,则上式对 j ， > -1/ k 成立，其中下标* 
表示最小收益率. A: = 0的情况看作为 A: — 0时的极限.参数 A: 称为形状参数.它 
控制了极限分布的尾行为.参数 f* = - l / k 称为分布的尾指数 . 

力程 (7.16) 的极限分办是 Jenkinson (1955) 对最小收益率的一般极值分布.它 
包含了 Gnedenko (1943) 中三种类型的极限分布. 

• 类型 1 k = 0, Gumbel 族，其 cdf 为 


F ^( x ) = 1 cxp[ cxp(x)], —oo < x < oo . 


类型 II k < 0, Prdchet 族.其 cdf 为 




u 


cxp[ (1 + ^ x < -1/A:, 

若 x > — l / k :. 


类型 III A: > 0, Wcibull (威布尔）族，这里其 cdf 为 


F .( x ) 


1 — oxp[ (1 I fcx) I/，fc ], 若 ; T > —1/A :， 
0, 若 a; < — Xfk . 


(7.17) 


(7.18) 
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Gnodcuko(1943) 给出了与上面的三种类型极限分布之一相联系的的 cdf 
的充要条件.简要地讲， F ( x ) 的 M 行为决定了最小收益率的极限分布 K ( x ) .与 
Gmnbel 族相联系的分布的 （左） 尾是指数衰 减的； 与 Prechet 族相联系的分布的 
( 左） 尾是 -个幂 函数与 Weibull 族相联系的分布的下端点是有限的（图 7-2). M 
于•极值理论的全面【寸论，读者可以参阅 Einbrcchts > Kuppclberg 和 Mikosdi (1997). 
在风险管理中，我们主要对 Frochet, 族感兴趣.它包含了平稳分布和学生分布. 
Giimbel 族包含了如正态分布、刘数正态分布等薄尾分布.方程 (7.16) 的一般极限 
分布的概率分布密度函数 (pdf) 可以很容 舄地通 过差分 得到： 


/•⑷= 


( 1 4- 1 Pvp[—(1 

exp[x — exp(ar)], 


若 A : # 0, 
若 fc =(): 


其中对 fc = 0, -oo < a ; < oo ; 对 fc < 0, :r < -1/ fc ; 对 k > 0, x > - l / k . 


(7-19) 



图 7-2 最小收益率的极值分布的概率密度 函数： 实线是 Gumbcl 分布； 点虚 
线是 fc = 【 ).5 的 Weibull 分布；虚线是 = —0.9 的 Frechet 分布 

前面提到的极值理论有两个重要的应用.笫一，的累积密度函数 F ( x ) 的尾 
部行为（而不是具体的分布 I 决定了（标准化的）最小收益率的极限分布.这 
样，此理论对于收益率 r , 的一个广泛的分布范围都是实际可行的.然而序列 { p n } 
和 {«„} 可能依赖于累枳密度函数 F ( x ). 第二 ， Feller (1971. P . 279) 证明了 M 指数 
k 并不依赖于 r t 的时间间隔.也就是说，尾指数（或等价地称为形状参数）在时阆 
累枳 F 是不殳的.极限分布的第二个性质在 VaR 计算中变得可以利用了. 

极值理论已经扩展到序列相关的观测值 { r ( } r =1 , 这里假 定这^ 相关是很弱的. 
Be r man (1964) 证明了假定 r , 的自相关函数是平方可积的（即< oc ), 其中 

是 n 的延迟/的自相关函数.则极限极值分布的同样形式对¥4|的正态序列也 
成立.关于序列相关性对极值理论的影响的进一步结果.读者可以参考 Leadbettcr , 
Liudgren 和 Rootzen (1983 ， 第 3 章)- 









7.5.2 经验估计 
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极值分布包含3个 参数： 仏，这些参数分别称为形状参数、位置参数和 
尺度参数.它们可以利用参数或非参数方法来估计.下面我们回顾一些估计方法. 

对于给定的样本，只有一个单一的最小收益率或最大收益率，并且我们仅用 
个极端观测并不能估汁这三个参数，因此必须利用另外的方法.文献中运用的一个 
想法就是将样本分成子样.并对子样应用极值理论.假定共有 r 个收益率 
我们将样本分成£/个互不相交的子样.且每个子样有 n 个观测值.为了简便.假定 
T = ng . 换句话说，我们将数据分为 

{ ^*1 1 " * " ， ’ ， il’n+li... 1 广 2 ， 1 1 ^2n+l ，’ . ’ ， r:J，i I • . . |r(g— 1 )n-M » * " * » ^"ng }» 

并将观测到的收益率记为 r in + J 1 其中1 < j 彡 n，i = 0，...， y —1. 注意到每个了样 
对应丁数据区间的个了区间.当 n 充分大时，我们屌望极值理论对每个子样都适 
用.在应用中 . n 的选择由实际情况来决定.例如，对于日收益率 ， n = 21近似对应 
于一个月内的交易日 数量 ； n =邱表示一个季度夂易日的数量. 

令表示第 i 个于样的最小值（即指第 i 个子样中的最小收益率)，其 
中卜标》用来表示子样的大小.当 n 充分大时， •!:„.< = ( r n ， t - 0 n )/ a n 应该服从一 
个极值分布，并且子样最小值的集合 { r ri ,,|i = I ,--- .»} 可以认为是从极值分布中 
抽取的 .9 个观测值的样本.具体来讲，我们定义 

r n.i = i = 1, •• - t ff. (7.20) 

子样最小值的集合 {/„.,} 是我们用来估计极值分布未知参数的数据.显然.得到的 
佔计可能依赖于子区间长度》的选择. 


1. 参数方法 

有两种参数方法可以利用 最大似然法和回归方法. 

2. 最大似然法 


假定子区间最小值 { r nii } 服从一般的极值分布，满足; r , = (〜.，- 久)/%的 
pdf 由方程 (7.19) 给出，我 f ] 可以通过简单的转换得到 h ., 的 pdf 为 


f(r n ,i) = 


1 + 


^ u ( r n,i ~^ n ) 


exp 


— fln 


l / k ，、 


exp 


exp 

r n,i 


] 


^■n { r n,i ~ i^n ) 




1/fcr 


，若 K ^= o , 


3]}， 若 n 


其中，若 h _ 0,则 1 十 k n ( r n , t - f 3 n )/ a n > 0. 形状参数 fc 屮加入下标 n ， 表示它的 
佔 it 依赖于 n 的选择.在独立性假定下，于区间最小值的似然凼数为 


’(■ 。 ‘ 山 .. .， /^7i) = J~J /(f'n.t)' 
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4 . 非参教方法 


形状参数叫以利用一些非参数方法来估计.这里我们将讨论两种这样的方 
法,这两种方法是由 Hill (1975) fO Pickands (1975) 提出的，分别称之为 Hill 估计 
和 Picbinds 估计.将两种估计都直接应用到收益率上.因此就没有必要考 
虑子样 /. 将样本的次序统计量表示为 


r (l) < r (2) ^ - < r (T)- 


令7为一个正整数.则&的两个估计定义为 


人 : p(*7) = 


N2) ln 


U r ㈣ 
- _r (2«j) ■♦- r (4«,). 


(7-24) 


k M = {lii[-r (0 j - ln[-r (v+1) ]}, (7.25) 

1 i=\ 

其中 变量⑷ 用来强调此估计依赖于 g. Hill 估计和 Pickands 估计之间的 g 的选 
择是不同的.几个研究者已经调査过，/的选择问题.但是还没有得到一般的对子 
可以利用的最好选择的结论 Dekkers 和 D t _ Haan (1989) 证明：对样本容量 7\ 如 
果 7 在一个恰当的选样间隔上是增加的，则 kM 是相合的.另外.他们还证明了 
s/q[k p {q) - k] 是渐近正态的.且均值为（)、方差为 h 2 (2~ 2k ^ 1 I l)/[2(2~ fc - l)lu(2)] 2 . 
Hill 估计仅仅对 Frcchct 族是适用的，但当它适用时，它比 Pic.ka.uLs 估计更有效. 
Goklie 和 Smith (1987) 证明 y/q[kh{q) - ^']是渐近正态的.且均值为（)、方差为人 - 2 . 
实际中，可以画出 HU 1 估 ii k h ⑷对 q 的图形，并且寻找一个恰当的使得估计是 
稳定的.可以用估计的尾指数 a = -\/k h [q) 来得到收益率序列的极值分位数.参 
见 Zivot 和 Wang(2(K)3). 


7.5.3 对股票收益率的应用 


我们对 IBM 股票从 1962 年 7 月 3 日至 1998 年 12 月 31 日的日对数收益率 
应用极值 理论. 收益率用百分比测量.且样本量为 9 190( 即 T = 9 190) .图 7-3 显 
示了当了区间的长度为21灭时，极端日对数收益率的时间图形，这近似对应于一 
个月. 从图中可以清楚地看到 1987 年 10 月的股市崩盘.排除 1987 年的股巾崩盘, 
极端日对数收益率的范围是 U.5% 到 13%. 

表 Y - i 概括了由 Hill 估计得到的形状参数为 A ‘ 的一些估计结采.此表显不对 
所给的的二种选择.结果都是稳定的.为/对 Hill 估计的表现提供一个全面的概 
况，图 7-4 显示了 Hill 估计 h ⑷对 g 的离散图.对正的和负的极端日对数收益率， 
除 JT V 很小的情形.估计都是稳定的.估计的形状参数大约是 -0.30. 在渐近 5% 水 
平下其显著地不同于 0. 图形也说明了对于负极端值.形状参数看上去很小.隐 
含了日对数收益率可能有一个更厚的左尾.总之，结果说明 IBM 股票的日对数收 
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m 7-3 当子区间是21个交易日时， IBM 股票的最大与最小日对数收益率，数据区间从 
1962年7月3日孕:1998年12月31日： （ a ) 正 收益； ⑹负收益 

益率的分布属于 FHchet 族.这样,该分析拒绝/实际中通常采用的正态性假定.这 
个结论与 Longiu (1996) 是一致的，他当时利用了美国股票市场指数序列.在 S-Plus 
中，可以用命令 hill 来得到 Hill 估计,例如 

ibm.hill = hill ( ibm f option = # xi ', end =500)• 



( a ) 月 S 大对数收益率 



表 7-1 IBM 股票从 1962 年 7 月 3 日至1998年12月31日的日对数收益率 Hill 
估计的结果 a 



190 

200 

21() 

最大值 

-0.300(0.022) 

-0.297(0.021) 

-0.30^(0.021) 

最小值 

-0.290(0.021) 

-0.292(0.021) 

-0.289(0.020) 


a 括兮内的数为标准误差. 


( a ) (右 坫) 



0 KM ) 200 3( K 1 4 U 0 5( H ) 

•i 


( l » 下捃(左馬) 

-0.4 
£ - 0.6 
-n.8 


m 7-1 IBM 股票日对数收益率 Hill 估计的敗点阁.子样区间从1962年7月3日至 
1998年12月： il 闩 ； ⑷正 收益； （ b ) 负收益 



0 100 200 300 4( K ) 500 

4 / 
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下面我们对 IBM 股票的日对数收益率应用最大自然法来估计一般极值分布的 
参数.对于子区间长度从1个月 （•〃. = 21) 到1年 （71 = 252) 的变化范围，表 7-2 概 
括了不同选择的估计结果.由此表，我们做出以下观测结果. 

•当 n 增加时，位置参数凡和尺度参数的估计的绝对值是递增的.这是 
可以预料的，因为子区间最小值和最大值的期望量值是 n 的不减函数. 

•当 n >63时.形状参数（或等价于尾指数）的估计对于负的极值是稳定的. 
近似为 -0.33. 

• 形状参数的估计对正极值不那么稳定.这个估计在数量上很小，但仍显著不 
同于 0. 

• 因为《 = 252 的子区间 s 的长度相当小，所以其结果具有高度可变性. 

得到的这个结果又类似于 Longin (1996) 的结论，他对将极值理论应用到股票市场 
收益率的分析提供了 •个很好的解释. 

表 7-2 的结果是由 Richard Smith 教授所幵发的 Fortran 程序（作者做了一 
定的修改）得到的.也可以用 S - Phw 来进行上述 估计. K 面演示/•在分析十•周期 
为21个夂易曰的最小收益率时用到的命令.注意收益率均乘以了 -100. 因为 （ a ) 
S - Plus 主要讨论分布的 右尾； （ b ) 收益率以百分比的形式给出.另外， S - Plus 中的 
Cxi , sigma , mu ) 分别对应表中的 (- k n , a n ,0 n ). ^ S - Plus 得到的估计与表 7-2 中 
的很接近. 


表 7-2 对 IBM 股栗从1962年7月3日至1998年12月31日 
的日对数收益率极值分布的 S 大似然估计 * 


了区间 K •度 

尺度 

位罝知 

形状#数 

1 个月 ( n =21, 9=437) 

锒小收益 
0.823(0.035) 

-1.902(0.044) 

-0 197(0.036) 

1 乎度 ( n =63, <7=145) 

0.945(0.077) 

-2.583(0.090) 

-0.335(0.076) 

6个月 ( n =126, g = 72 ) 

1.147(0.131) 

-3.141(0.153) 

-0.330(0.101) 

1 年 （ n =252, r /=36) 

1.542(0.242) 

-3.761(0.285) 

-0.322(0.127) 

1 个月 ( n =21, S =437) 

最大收益 
0.931(0.039) 

2.184(0.050) 

-0.168(0.036) 

1 李度 ( n = G 3, e ;=145) 

1.157(0.087) 

3.012(0.108) 

-0.217(0.( Ki 6) 

6 个 H ( n =126, g = 72 ) 

1.292(0.158) 

3.471(0.181) 

-0.349(0.130) 

1 年 （ n —252, y ^ 3 ( i ) 

1.624(0.271) 

4.475(0.325) 

-0.2 M (0.18«) 


a 括号内的数值为怀准误差. 


GEV 估计的 S - Plus 演示 

收益率序列是 ibm . 

>length(ibm) 

[1] 9190 
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>grp Br floor (9190/21) 

>sn> 

[1] 437 

>for(i in 1:grp){ 

+jend=9190-(i-l)*21 

♦jst=jend - 21+1 

+xmin[i]=min(ibm[j st:j end]) 

>y=xmin«(-100) 

>nibm.gev.21=gev(y) 

>names(nlbm.gev.21) 

[1] "n.all" M n“ “call" "block" "data" 

[6] "par.eats" "par.ses" "varcov" "converged" "nllh.final M 
>nibm.gev.2l$par.ests 

xi sigma mu 

0.1953325 0.8187631 1•921797 

>nibm.gev.21$par.ses 

xi sigma mu 

0.03539358 0.03456347 0.04387343 
>plot(nibm.gev.21) 

Make a plot selection (or 0 to exit) : 

1: plot: Scatterplot of Residuals 
2: plot: QQplot of Residuals 
Selection: 





图 7-5 给 IBM 股票的负的日对数收益率拟合 GEV 分布时的残差图.数据的时间区间 
是从1962年7月3 R 到1998年12月31日.数据以百分比形式给出，且 f 区 
间长度是21个交易口 







定义所拟合的 GEV 分布的残差是 
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利用 GEV 分布的概率密度函数以及变量的变换，可以很容易 证明： 如果所拟合的 
模型是正确的，则{!/;，}应该是一列独立同指数分布的随机变量.图 7-5 显示了给 
IBM 股票的负的日对数收益率拟合 GEV 分布时的残差图.子周期长度是21个交 
易日.左边的图给出了残差，右边的图给出了对指数分布的 QQ 图，图像表明拟合 
是合理的. 


7.6 VaR 的极值方法 

本节将讨论利用极值理论的 VaR 计算方法.该方法类似于 Longin (1099 a , 
1999 b ), 他出于同样的目的提出了一个八步程序.我们将讨论分为两个部分.第一 
个部分关心的是利用节讨论的方法得到的参数 估计； 第二个部分通过将感兴趣 
的概率与不同的时间区间相联系.集中讨论 VaR 计算. 

第一部分 

假设样本区间上可以利用的资产收益率有 r 个观测值.我们将样本区间分解 
为分个互不相交的长度为 n 的子区间，满足7 1 =叩.如果 T = ng m , I m < n , 
那么我们将前 m 个观测值从样本中删除 . 7.5 节中讨论的极值理论使我们能够得到 
对子区间的最小值 { r n > i } 的位置参数义、尺度参数 a n 以及形状参数 it T , 的估计. 
将最大似然估计代入方程（7.]6)的 cdf , 其中， x =( r - /? n )/ a n , 则我们可以得到一 
般极值分布在给定概率下的分位数.因为我们集中于讨论持有多头金融头寸，所以 
感兴趣的是下（或左）分位数.令 〆 为一个小概率.它表示一个多头头寸的潜在损 
失超过一定限度的可能性.且弋为子区间最小值在极限为一般极值分布条件下的 
P *- 分位数，则我们有 


P 


1 — exp 
1 一 exp 


C 丨 ‘( d) ) 1A ” 

r n ~ \1 


— exp 




，若左 n 一 0, 
若人 : n = 0. 


这里可以理解为，对于# 0,有1 + A ： nK -^)/ a n >0. 将这个方程改写为 


ln(l - 〆 ）=*{ 


— exp 


Kir: 一 "n)l 1/Ar 


一 0n 


，若 fc „ 

若 = 0. 
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我们得到分位数为 


Pa ~ -r^{l - [— ln(l — } ，若 / ()， 

r* = < Kn (7.26) 

[ /3 n +a„ln[-ln(l-p*)], 若 A：，, = 0. 

在金融应用中，主要感兴趣的就是 Ar „ 尹 0 的情形. 

第二部分 

对于一个给定的下尾（或左尾）概率 p % 方程 (7.26) 的分位数 < 就是在对子 
区间最小值的极值理论基础上计算的 VaR . 下一步就是制定子区间最小值与观测 
的收益率序列 r t 之间的明确关系. 

因为大部分资产收益率或者是序列无关的.或者有很弱的序列相关件，所以我 
们可以利用方稈 (7.15) 的关系.得到 

P m = P[rn,i ^r；) = l-[l-P(r t ^ r；)} n 

或等价地 

l-p* = [l-P(r^r ； )r. (7.27) 

概率之间的这种关系允许我们得到原始的资产收益率序列,的 VaR . 更精确地讲， 
对于一个特定的很小的下尾概率/>，如果 〆 是根据方程 (7.27) 选择的，则^的 P 
分位数是 <，其中 p = P(r t ^r； t ). 因此.对给定的小概率 />, 持有一个对数收益率 
为 r t 的标的资产，其多头头寸的 VaR 为 

0n — -r~ {l — [― nln(l — P) 产 ‘ } ，若 A:„ — 0 ， 

VaR= I ^ (7.28) 

[ /^n -f «n ln[-nlu(l -p)J, 若 = 0 ， 

其中 n 是子区间的长度. 

小结 

我们将应用传统的极倌理论来计算 VaR 的方法概括 如下： 

(1) 选择子区间的长度 n , 并得到子区间的最小值/ = 1,…， g , 这里 
9 = \T/n]; 

(2) 得到汉,，和匕的最大似然 估计； 

(3) 检査拟合的极值模型的充分性，可参见下一节中模型检验的一些 方法； 

(4) 如果极值模型是充分的，则可应用方程 (7.28) 计算 VaR . 

注释：囚为我们集中 f 讨论持有一个多头金融头寸，即讨论收益率分布的左 
尾分 位教. 囚此，分位数是负的.然而.实际中习惯于利用一个正数来计算 VhR , 这 
样，在利用方程 （7.28) 时，应该意识到负号代表一个损失. 口 
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例 7.6 考虑 ffiM 股票从 1962 年 7 月 7 曰至 1998 年 12 月 31 曰，以百分比表示 
的闩对数收益-由表 7-2, 对 n = 63, 我们有 = 0.945, 0 n = -2.583, k n = 0.335. 

因此.对左尾概率 p = 0.01, 相应的 VaR 为 

VaR = -2.583 - {l - [-63 ln(l - 0.01 )1-°- 335 } 

—U.ooO J 

=-3.049 69. 

这样.对于股票的日收益率,1%分位数是 -3.049 G 9. 如果某人持有这只股票价值1 
T •万美元的一个多头头寸，则概率1%的 VaR 估汁为 1(1000 000 x 0.030 490 9美元= 
304 9 G 9 美元.如果概率是 0.05, 则相应的 VaR 为166 641美元. 

如果我们选择 n =21( 即近似于1个月)，那么= 0.823,九= -1.902, 
A '„ = - U .197, 极值分介的 1%分位数为 

0 

VaR - -1.902 - — 0 19 7 ^ ~ [- 21 Iu U - 0.01)]-° 197 } = -3.40() 13. 

所以，对于一个1千万美元的多头头寸，在1%风险水平上对应的1天持有期的 VaR 
为加0 OI 3 美元.如果概率是 0.05, 则对应的 VaR 为184 127美元.在这个特殊的 
情形， n =21 的选择给出了更髙的 VaR 值. 

例 7. G 中用极值理论得到的 VaR 值小于例 7.3 中用 GARCH (1,1) 模型得到的 
VaR 值，这一点有些奇怪.事实上，例 7.6 屮的 VaR 值甚至小于例 7.5 中根据经验 
分位数得到的 VaR 值. 出现这种情况的部分原因是由于概率为 0.05 的选择.如果 
某人选取概率为0.001=0.1% ,并考虑问样的金融头寸，那么我们有 n = 21时，对 
商斯 AR (2)- GARCH (1.1) 模型. VaR =546 C 41 美元；对于极值理论有 VaR =666 590 
美元.而且,这里通过传统的极值理论得到的 VaR 可能并不充分.因为统计检验经 
常拒绝了日对数收益率的独立性 假定. 最后，子区间最小值的应用忽视了日对数收 
益率中波动率聚类的事实 • 7 . 7 节将要讨论的极值理论的新方法克服了这些 缺点. 

注释：例 7.6 中的结果显示，根据传统的极值理论计算的 VaR 依赖于 n . 的 
选择，其中 n 表示子区间的长度.因为板限的极值分布成立，所以扃该选择一个大 
u . 但是当样本量7 1 固定时，一个大 n 意味着一个小仏其中^为估计三个参数 
和时运用的有效样本量.因此，需要在 n 与 g 的选择中作一些妥协.应根据 
所研究资产的收益车给出一个恰当的选择.我们建议在运用传统的极值 理论时 .应 
该检验结果中 VaR 的稳定性. □ 

7.6.1 讨论 


我们已经对一个1千万美元的多头头寸中的 IBM 股票日对数收益率的 VaR 
计算运用了各种不同的方法.考虑下一个交易日头寸的 VaR . 如果概率是5%，这 
意味着在下一个交易日中，损失将以概率95%低于或等于 VaR , 则得到的结 果为： 
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(1) 对于风险度量制•为302 500 美元； 

(2) 对高斯 AR (2)- GARCH (1,1) 模型，为287 200 美元; 

(3) 对自由度为 5 的标准化学生 t 分布的 AR(2) GARCH(1,1) 模型，为 
283 520 美元； 

(4) 对运用经验分位数时，为 21 G ( WO 美元； 

(5) 对利用月最小值（即子区间长度 n =21) 并运用传统的极值理论方法时.为 
184 127美元. 

如果概率为1%,则 VaR 为 

(1) 对于风险度量制，为426 500 美元； 

(2) 对高斯 AR(2)-GARCH(1,1) 模型，为 409 738 美元； 

(3) 对自由度为 5 的标准化学生 f- 分布的 AR(2)-GARCH(1,1) 模型，为 
475 943 美元； 

(4) 对运用经验分位数时，为365 7 TO 美元. 

(5) 对利用月最小值（即子区间长度 n =21) 并运用传统的极值理论方法时，为 
340 013美元. 

如果概率为0.1%，则 VaR 交为 

(1) 对于风险度量制，力 56 G 443 美元； 

(2) 对高斯 AR.(2)-GAHCH(1,1) 模型，为 546 641 美元； 

(3) 对自由度为5的标准化学生分布的 AR (2)- GARCH (1,1) 模型，为 
836 341 美元； 

(4) 对运用经验分位数时，为 78 0 7 12美元. 

(5) 对利用月最小值（即子区间长度 n =21) 并运用传统的极值理论方法时.为 
666 590美元, 

不同方法间有着不小的区别.这并不令人惊奇，因为在估计统计分布的尾行为 
时存在较大的不确定性.由于没有真实的可以得到的 VaR 来比较不同方法的精度, 
我们建议运用几种方法来获得 VaR 的一个范围. 

尾概率的选择在 VaR 计算中也起着重要的作用.对于 IBM 股栗的日收益率, 
因为样本量为9 190,使得5%和1%的经验分位数都是收益率分布的分位数的适当 
估 【I . 在这种情形下，我们可以将基丁经验分位数的估 II 结采当作真实 VaR 的一个 
保守估 il (即一个下界).以这个观点，对 IBM 股票的日对数收益率而言，基于传统 
极值理论的方法看上去低估了 VaR . 下一节将要讨论的条件极值理论的方法就克 
服了这个缺点. 

当尾概率很小（例如0.1%)时，经验分位数是真实分位数的一个不太合理的估 
计.基于经验分位数的 VaR >(、能冉充当真实 VaR 的一个卜界. 最后， 前 it ] 的结果 
很清楚地说明当尾概率很小时，在 VaR 计算中运用了厚尾分布的效应.在概率为 
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( U % 时，基于自由度为5的学生 /- 分布的 VaR 或基丁-极值分布的 VaR 都高于基 
于正态假定下的 VaR . 

7.6.2 多期 VaR 

风险度量制方法的时间平方根法则变成了运用极值理论时的一个特殊情形 . / 
天持有期与1天持有期之间的关系为 

VaR(Z) = l l/a VaU - r fc VaR. 

其屮 rv 是尾指数，是极值分布的形状 参数. 具体可参见 Dauielsson 和 de Vries 
(1997 a ). 这个关系称为时间〜根法则，这里 a = 且不是尺度参数 

为了解释.考虑例 7 .(5中 TOM 股票的日对数收益率.如果我们用 p = 0.05 以 
及” _ 2】的结果，则对 3() 天持有期，我们有 

VaR (30) = (30 ) O M5 VaR = 3.125 x 184 127美元= 575 397美元. 

因为 i ° 335 < /°- 5 ,则时间根法则产生了比时间平力根法则更低的/天持有期的 
VaR. 


7.6.3 空头头寸的 VaR 

本小节将给出持有一个空头头寸的 VaR 计算公式.这里感兴趣的是子区间的 
最大值，并且极限的极值分布变为 


expJ -[ i -^. ( rr ^)] "I 若0, 


F.(r) 


exp - exp 


' r -0 T , 


(7.29) 


若 fen = I )， 


其中 r 表示子区间的最大值.这里对 Av , 兴 0. 可以理解为有1 - - /? n )/ a n >0. 

与多头头寸的程序炎似，我们得到收益率^的 （1 - p )- 分位数为 


凡 + f I 1 — [― 7, 叫 1 — #)产 } ，若心 _ 0 , 


pn + «n ln[-n ln(l — p )]， 


若 fc " = 0, 


(7.30) 


其中 p 是一个小概率，表示持有一个空头头寸时损失的机会 . n 是子区间的长度. 

7.6.4 收益率水平 


基于子区间极值理论的另外一个风险度量是收益率水平 . g 个长度为〃的？ 
区间的收益率水平 L n , 9 定义为这样一个 水平： 该长度为 n 的子区间中有1/#个超 
过了该水平.即 

P(. r n，i < L n .g) = -， 
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其中 r T 1 ,, 表示子区间的最小值.收益率水平所超过的那个子区间称为重点区间 
(stress period). 如果子样本区间足够大使得标准化后的 r „. i 服从 GEV 分布，则 
收益率水平为 

L n ,g = /3 r » + T ~{[—1^(1 — \/ g)) kn — 1}, 

上式中假定 K ^ 0. 注意，这是由 (7.26) 式所给出的极值分布的精确分位数，尾概 
率为 〆 = 1/^它们只是在书写的形式上有所不同.因此.收益率水平是应用到子 
区间的最小值（或最大值）而不是标的收益率本身.这也正是 VaR 与收益率水平的 
区别所在. 

对于子区间长度为 21 天的 IBM 股票的负的日对数收益率，我们可以用所拟 
合的模型得到 12 个这种子区间（即， p = 12) 的收益率水平为 -4.4835%. 

计算收益率水平的 S - Plua 命令 

> rl . 21 .12= rlevel . gev ( nibm . gev .21, k . blocks =12 # 

♦ type = # profile # ) 

> class ( rl .21.12) 

【1】 " list " 

> names ( rl .21.12) 

【 1 】 "Range" M rlevel" 

> rl .21.12 $rlevel 
[1] 4.483506 

在 S - Plus 中，子区间的数量由 k . blocks 表示，子命令 type =' profile * 产生收 
益率水平对数似然置信区间的概图.该图并没有在这里给出.类型的另外一个子命 
令是 type = ' RetLevel \ 

如果用子区间的最大值，则收益率水平定义为 P ( r u ,i > L n , g ) = \/ 9l 其中 
表示子区间的最大值.同样，最大值利用 GEV 分布，我们得到 

Ln，g = — [- lll(l - / 分 ) 卜}， 

九 n 

其中 g 为子区间的数量. 

7.7 基于极值理论的一个新方法 

前面提到的利用极值理论计算 VaR 的方法遇到了一些困难.首先，子区间长 
度 n 的选择并没有给出清楚的定义.其次，该方法是无条件的，从而没有考虑其他 
解释变景的影响.为了克服这些凼难，统计文献中已经提出，极值理论的规代方法. 
具体可参见 Davisoii 和 Smith (1990) 以及 Smith (1989). 新方法并不着重于讨论 
极值（最小值或最大值)，而是着重讨论对某个髙门限的超出量和超出发生的时间. 
因此该新方法也称为超出门限的峰 (peaks over threshold (POT)) . 例如，考虑本章 
中所用到的 IBM 股票的日对数收益率，以及持有该股票的一个多头头寸.令 w 表 
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示一个指定的高 门限. 我们可以选择 r ? = -2.5%.假设第 i 次超越在第卜天发生 
(即 r t . < 77), 则新方法集中于讨论数据 - W ), 其中 r t . —77 为超过门限 r ； 的超 
越量.且/，表示第；:次超越发生的时间.类似地，对一个空头头寸，我们可以选择 
ti = 2%, 并讨论数据 - T]), 这里 r t , > 

实际中，发生时间{^}提供了关于重要的‘稀少事件’，(如对多头头寸而言低于 
门限 W 出现强度的有用的信息 . ^的一个聚类表示了一个人的市场低迷期.超越 
量 r t , _ 7/也很重要.因为它提供了我们感兴趣的实际量. 

根据前面的介绍，新方法并不要求对子区间长度 n 的选择，但是它要求指定一 
个门限，/.门限//的小同选择将导致形状参数 fc (从而尾指数 -1/ A -) 的不同估计.在 
文献中，一些研究者相信 r / 的选择既是一个统计问题.又是一个金融问题.它不能 
纯粹地根据统计理论来确定.例如，不同的金融机构（或投资者）具有不同的风险 
容忍度.这样，他们即使对于相同的金融头寸也可以选择不同的门限.对于本章中 
考虑的 IBM 股票的日对数收益率，计算的 VaR 对的选择是不敏感的. 

门限 的选择也依赖于观测到的对数收益率.对一个稳定的收益率序列.选择 
;/ = - 2 .?5%对多头头寸而言是相当好的.对一个有较大波动的收益率序列（例如网 
络股的日收益率)，77可能低至-10%.有限的经验表明.可以通过选择％使得超越 
的次数足够大（如大约为样本总数的5%).对于选择的一个更加正式的研究，可 
以参见 Dmiiclssou 和 de Vries (1997 b ). 

7.7.1 统计理论 

再一次考虑资产的对数收益率 rt . 假定第£个超越在^时刻发生.集中讨论超 
越董77 - v 和超越时刻将导致统计想法的重要变化.新方法并不使用边际分布 
(如最小值或最大值的极限分布)，而是采用一个条件分布来处理给定观测超过一个 
门限的条件下超越量的 大小. 超过门限的机会是由概率规律控制的.换句话说，新 
方法考虑了多头头寸在给定 r t < 7 j 下， t = r t - v 的条件分布•車件 { r , < r/ } 的 
出现服从一个点过程（例如一个泊松过程)，对泊松过程的定义可参见 ( J .9 节•具体 
地.如果过程的强度参数 A 随时间不变，则泊松过程是齐 次的； 如果 A 随时间变化， 
则泊松过程是非齐次的.泊松过程的概念可以一般化到多元的情形 • 

为了表示方便.下面我们利用一个正门限以及收益率分布的右侧来讨论极值理 
论新方法背后的统计 理论. 这相当于持有一个空头头寸 • 然而，如果将此理论运用 
到" r 序列， r? = - rf ， 则该理论对于一个多头头寸适用得也同样好这一点很容易 
看出，因为对一个正门限 O %等价于 r t < -％这里-7?变为一个负门限. 

新方法的基本理论是对于方程 (7.29) 中给出的最大值的极限分布考虑给定 
r > "下 r : or + w 的条件 分布. 因为没有必要选择子区间的长度 n , 所以我们 
不用它来表示一个参数的 下标. 给定 r > r / 条件下, + 的条件分布为 
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、 Pr ( r ? ^r^x-^T]) Pr(r 彡 x + t ，）一 Pr(r 彡") 
Pr(r dl …卜 ^ Pr(r >T )' 1 - Pr(r q ) 


(7.31) 


利用方程 (7.29) 中的累积分布函数 F *(.) 以及近似« 1 ?y, 经过一些代数运算 
之后.我们得到 


Pr(r^ + ,lr>,) = F ^^p 


exp 

k(x + T} - /3)' 

1 

a 


^ Kv - 3) 

i/fc| 

1 — exp / — 

卜 Kv-P) 

i/fc j 


« i 


kx 


a - k{Ti - P ) 


i/fc 


(7.32) 


其中 x > 0, 且 1 - Ar(7] - /?)/« > 0. 以后将会看出，这个逼近使得新方法与传统的 
极值理论之间的连接更明确了 . = 0的情形可看作是 fc — 0的极限，从而 


Pr(r ^ X r]\r > rj) ^ I - exp(-x/a). 

称下述累积分介函数为广义帕累托分布 (GPD), 

I . kx 1/fc ' 

1- l-TTT ， fc #(). 

L 州） J (7-33) 

1 — exp[—x/xj}(rj)], A： = 0. 

其中 Mv) > 0,且当 A •彡 0 时,: r > 0; 当 fc > U 时， U 彡 a: 彡 ^( V )/k. 于是， (7.32) 
式的结果表明给定 r > r/ 时 r 的条件分布可以由 GPD 很好地近似•该 UFD 的参 
数 为左和 ♦) =a-k{-n-fi). 更多的信息可参见 Embrechts 等 (1997). GPD 的 
一个重要性质如下.假定在给定门限％时 r 的超额分布为 GPD， 且其形状参数为 
k， 刻度参数为 iHmh 则对任意的门限，? >加，给定门限 r/ 的超额分布也是 GPD, 
并且其形状参数为 fc , 刻度参数为训 r/) = - k(7, - no)- 

当 fc = I)时，（7.糊式的 GPD 退化为指数分布.该结果使得我们可以利用超出 
某个门限的超额收益对指数分布的 QQ 图来推断收益率的尾部行为 • 如果 fc = 1 
则 QQ 图是一条直线.图 7-6a 给出了本章所用的 IBM 股票的负的日对数收益率的 
QQ 图.这里门限为 0.025. 图像的非线性清楚地表明了 U3M 对数收益率的左尾要 
比指数分布的厚，即 A ^0. 
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"-fin 0 1() 0,15 0.20 0.25 

有序数据 
(1>)超额均值图 

m 0. 10 

• 0.06 
qzi 

m 0.02 

-0.10 -0.05 0.0 (1.05 0,10 

门限 

图 7 -(i 从 1962 年 7 月 3 日到1998年12月31日的 IBM 股票的负日对数收益率的 
图像： （ a ) 门限为2.5%时超额收益率的 QQ 图； （ b ) 超额均值图 

绘制图像 7-6 时所用到的 S - Plus 命令 

> par(mfcol^c(2,1)) 

> qplot( - ibm,threshold=0.025 # 

♦ inain= ’Negative daily IBM log returns # ) 

> meplot(-ibm) 

> title(main = 9 Mean exceoo plot 9 ) 

7.7.2 超额均值函数 

给定一个高的门限 Vo 时，假定超额收益 /• -服从参数为和 的 GPD . 
其中0 > A ： > -1. 则超过门限 r / o 的超额均值为 

E ( r - rj 0 lr > r JO ) = P ^4. 

1 + A : 

对于任意 7/ > 0, 定义超额均值函数 e (7?) 为 

e(T f) = E(r-r,\r > r;) = ~ k(r, - r, 0 ) 

1 I k 

换吉之，对任意 v > 0， 

c(r / 0 I y) = E[r - (rfo 十从）卜 > ， /o 十 ？ /] = "’(’f) : 人 ' V . 

1 + A ： 

因此. 对于固定的 / r . 超额均值函数是 j / = t ? -如 的线性函数.该结果引出了一个简 
单的绘图方法来对 GPD 推断出一个合适的门限值^定义经验超额均值函数为 

1 ^ 



G 543210 


er (") = 


.「*•—")， 


(7-34) 
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其中是超出 r / 的收益率的数量 . r * t . 是相应的收益率的值.对于记号上的更多信 
息参见下一小节. er ⑻对 r ; 的散点图称为超额均 值图. 当 W >加时，该图关于7; 
是线性的.图 7- fih 给出了 IBM 股票的负日对数收益率的超额均值图.该图表明， 
与其他值相比而言，门限值取3%对负的日对数收益率是合理的.在 S - P 1 ils 中绘制 
超额均值图的命令是 meplot. 

7.7.3 极值建模 的一个 新方法 

利用方程 (7.32) 的统计结果，并且联合考虑超越量与超出时间 . Smith (1989) 
提出了一个二维泊松过程来对建模 . Tsay (1999) 利用这个方法来研究风险 
管理中的 VaR . 本节我们利用同样的方法. 

假定基本的时间间隔为 A 其典型的取法是1 年. 在美国，因为1年中一般有 
252个的交易日，所以使用£> = 252.令表示数据点的时间间隔（例如日)，并将时 
间区间表示为 t = 1,2,... ， r ， 其中了代表全部数据点的个数.对个给定的门限 
•/ 7 , 超出 N 限的超额时间用来表示，在点观测到的对数收益率 
为 r t ,. 因此，我们集中讨论对 i = h ". 為 建模，这里①依赖于门限 

V - 

运用极值理论的新方法是猜想超越时间与相关收益率[即 ( U ， r tt )} 联合形成了 
一个二维的泊松过程,其强度测度由下式给出 

A[(D 2 ,D0x (r,oo)] = D ^ ~ D D ± S {r^ix^), (7.35) 


其中 S ( r ., k ， a ,/3) = [l - A：(r ~ /j) 1 ， 0 < D , < D 2 7\ r > 77 ，n > 0, /? 和 A : 是参 

. a J + 

数.记号定义为 = max ( x ,0). 这个强度测度说明，超越门限的出现与时间 
段 [ D ,, D 2 ] 的长度成正比.并且此概率可以由类似于方程 (7.29) 中累积分布函数 
F *( r ) 的生存函数的指数来控制.随机变量 X 的生存函数定义为 S ( x ) = Pr(X > 


•r) = 1 — Pr(X ^ x) = 1 — cdf(x). 

当 ) t = 0时.强度测度可看作 A --.0 的极限，即 


A[(D 2 , D \) x ( r , oo)] 


D2 一 — (r - p) 

__^ exp 


方程 （7.35) 中.时间间隔的长度是相对于基本区间长度 D 来度量的. 

在考虑时间段 [0, D ] _ t , 给定 r > T] 条件下， r = r + i 7 (；r > 0) 的隐含条件概率 
时.利用方程 (7.35) 中的强度测度的思想将变得非常淸楚. 


A[(0,.P) x (x -f r/, oo)] _ 1 - k(x +t? - (i)/a ' /k _ L_ kx x/k 

A[(0, D) x (t/, 00 )] • 1 — k(rj — /9)/a . L a — k(r] — 0) 
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恰是方程 (7.32) 中给出的条件分布的精确生存函数.这个生存函数是从由方程 
(7 29) 给出的最大值的极限极值分布得刭的.这里我们利用了生存函数，因力它代 
表了超越所发生的概率. 

方程 (7.29) 中的极限极值分布与方程 (7.35) 中的强度测度的关系直接将极值 
理论的新方法与传统方法连接了起来. 

数学上，方程 (7.35) 的强度测度可以写为一个强度凼数的积分 

rOO 

八 x ( r ， oo )] = A ( t , 2 ； A :, a , 0 ) dtdz , 

J£)j Jr 

其中强度函数 A ( t ,2； A :, Q , ( i ) 定义为 

\% z \ k , a ,/ 3 ) = — g ( z ] k , a ,/ 3 ), (7.36) 

其中 

r i r, K2 - p)^- 1 廿 , 

，若…， 

g(z,k,a,/3 )= < 

i r i _ 

— exp I - s ， 若 fc = (). 

Of l Ot 

利用泊松过程的结果,我们可以写下观测到的超越时间与相应收益率 {( ti , r t )} 
在二维空间 [0, N ] x (/^ oo ) 上的似然函数为 ’ ’ 

! \ r T , 

L { k , n ,( 3 ) = I ]J ^ 9 ( n . , k , a , p ) \ x exp 5( r /; A , a ,^) . (7.37) 

参数 A :, a ,/ i 可以通过最大化这个似然函数的对数来估计.因为尺度参数是负的， 
所以在估计中我们利用了 ln ( a ). 

例 7.7 再次考虑 IBM 股票从 l % 2 年 7 月3曰至 I " 8 年 I 2 月31日的日对数收 
益率，共有 9 个曰收益率的值•表 7-3 给出了负序列 {- rt } 在门限的三种选择 

下参数的一些估计 结果. 我们利用了负序列 {- n }, 而不是 { r< }， 这是因为 
我们集中于讨论持有一个多头的佥融头寸.此表也给出了给定门限下的超越次数 
町 以看出 IBM 股票在1天中降低 2 . 5 %或者更多的机会出现的概率为310/9 19() 约 
为3.4%.因为 IBM 股票收益率的样本均值不是0,所以我们也考虑了当样本均值 
从原始的对数收益宇•中去除以后的情况 • 从表中看出， 去除样 本均值后对参数估计 
只有很小的影响.下面利用这些参数估计来计算 VaR . 注意在 实际应 用中必领要仔 
细检査拟合一个泊松模型的充 分性. 下面我们将讨论模型检验的 方法. 
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表 7-3 对 IBM 股票从 1962 年 7 月 3 R 到 1998 年 12 月 31 日的 
负日对数收益率的二维齐次泊松模型的估计蛣果 a 


Thr . 

Exc . 

形状参数知 

对数（尺度 )〖 n («) 

位 M 0 



原始的对数收益 


3.0% 

175 

-0.306 97(0.090 15) 

0.3 U 6 99(0.123 80) 

4.692 04(0.190 58) 

2.5% 

310 

-0.264 18(0.065 01) 

0.315 29(0.112 77) 

4.740 62(0.180 41) 

2.0% 

554 

-0.187 51( U . U 4 ；J l J 4 J 

0.276 55(0.098 (57) 

4.810 03(0.172 ()5)) 



移除杵本均值 


3.0% 

184 

-0.305 16(0.088 24) 

0.308 07(0.123 95) 

4.738 04(0.191 51) 

2.5% 

334 

一 0.281 79(0.067 37) 

0.319 68(0.120 65) 

4.768 08(0.185 33) 

2.0% 

590 

-0.192 60(0.043 57) 

0.279 17(0.099 13) 

4.848 59(0.172 55) 


堪本的时间间隔为 252 灭（即一 年 ). 括号内的数为标准误差，其中 “Thr.” 和 “Exc” 表示门限 
(threshold) 和超越次数 （number of excoedings). 


7.7.4 基于新方法的 VaR 计算 

正如方程 (7.32) 显示的，运用的二维泊松过程模型（它采用了方程 （ 7.35) 中的 
强度测度）与方程 (7.29) 中的极值分布具有同样的参 数值. 因此，可以利用与方程 
(7.30) 同样的公式计算新方法下的 VaR. 更具体地.对一个给定的 卜尾 概率 p . 对数 
收益率 n 的 （1 一 p )- 分位数为 

( 0 + * r { 1 — [-£^ ln(l — p )] fc }， 若 fc 〆 0， 

VaR = { k (7.38) 

L (3 o. lii [ — D ln(l _ p )]， 若 1 = 0 ， 

其中 £> 为估计中使用的基本时间间隔典型地，美国利用 D = 2 J 52 表示1年中交 
易日的近似数量. 

例 7.8 再次考虑持有一个价值 1 千万美元的 IBM 股票的多头头寸的 情形. 我们 
利用表 7-3 中的估 I 十结果对尾概率为 ().05 和 0.01 计算持有期为1天的 VaR . 

情形 1 利用原始的日对数收益率.门限 G 的三种选择导致了下面的 VaR 值： 

(1) 7/ = 3.0%: VaR (5%)=$228 239, VaR ( l %)=$3 r )9 303; 

(2) ii = 2.5%: VaR(5%；=$219 106, VaR(l%)=$301 119; 

(3) r/ = 2.0%: VaR(5%)=$212 981, VaR(l%)=$368 552; 

情形 2 消除日对数收益率的样本 均值. 门限 // 的三种选择导致 / 卜面的 VaR 
值： 

(1) // = 3.0%: VaR(5%)=$232 094, VaR(l%)=$363 C97; 

(2) r/ = 2.5%: VaR(5%)=$225 782. VaR(l%)=$364 254; 

(3) T] = 2.0%: VaR(5%)=$217 740, VaR(l%)=$372 372. 

正如料想的，消除样本均值（正值）将使 VaR 稍微有所增加.然而， VaR 在门限的 
三种选择下相当稳定.实际中，我们建议将新方法运用到 VaR 计算中之前首先消 
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除样本均值 . 


讨论与例 7.6 中的 VaR 相比（那里使用了传统的极值理论)，新方法提供了一个 

更加稳定的 VaR 计算 . 传统方法对于子区间长度 n 的选择是相当敏感的 . 

7.7.5 参数化的其他方法 


如同前面提到的那样 . 对于给定的门限 r/, GPD 也可以通过形状参数 1 和刻度 

参数 0(r;) = a — k(ij — /i) 讲行参数化 . 这 iK 是 S-Plus 中所用到的参数化 . 事实卜.， 

S-Plus 中的 （ xi, beta) 对应于本章的（ - 在 S-P1uk 中估计 GPD 模型的 

命令是 gpd. 为了说明，考虑从 1962 年到 1998 年的 IBM 股票的负日对数收益宇 

结果如下： 


>nibm. gpd"-gpd (- ibm ， throehold^O. 025) 

>nam©s(nibm.gpd) 


[1] M n" 

"data" 

[3] "upper.exceed" 

"lower, exceed' 1 

[5] "upper • thresh* 1 

11 lower, thresh* 1 

[7] "p.less.upper.thresh" 

"p.larger.lower.thresh" 

[9] "n•upper.exceed" 

••n • lower. exceed" 

[11] *'upper.method" 

11 lower, method" 

[13] "upper•par.ests" 

"lower.par.ests" 

[15] "upper.par.ses•• 

_• lower. par • est s •’ 

[17] M upper.vaxcov" 

"lower.varcov" 

[19] "upper.info" 

"lower.info" 

L21J H upper.converged" 

•• lower, converged" 

[23] "upper.nllh.final•• 

•• lower • nl m ： inal ’• 

>nibm.gpd$upper.thresh 


[1] 0.025 


>nibm. gpd$n. upper. excued •/• 

uumbur ol exceedances 

[1] 310 


>nibm. gpd$p. less. upper. thresh •/• 1-prob (exceedance) 

[1] 0.9662677 


>nibm.gpd$upper.par.eats 

• 

xi beta 


0.9641418 0.00778777 


>nibm.gpd$upper.pax.ses 


xi beta 


0.06659759 0.0006715558 


>par(mfcol=c(2,2)) 


>plot(nibm.gpd) 
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Make a plot selection (or 0 to exit) : 

1: plot: Excess Distribution 

2: plot : Tail of Underlying Distribution 

3: plot : Scatterplot of Residuals 

4: plot : QQplot of Residuals 

Selection: 

注意到结果与表 7-3 中的结果非常靠近.表 7-3 中用的是对数收益率的百分比. 
在表 7-3 中 A : 和 咖 的估计分别是 -0.264 18和 a - ik ( T / - /?) = exp (0.3152 9) - 
(—0.264 18)(2.5 - 4.740 6) = 0.778 73. 对于对数收益率，懒的估计是 0.007 787. 
这与 S-Plus 的估计结果一样. 

图 7-7 显示了给 IBM 股票的负日对数收益率拟合 GPD 的诊断检验图 . QQ 图 
(右下角）和尾概率估计（左下角.并取对数刻度）显示出与直线有微小的偏差这 
表明可能需要进一步的改进. 


0.1 0.2 0.3 


0 2 4 fi 8 


以对败尺度） 序列数 

图 7-7 给 IBM 股票拟合从1962年7月3日到1998年12月31日的负日对数收益率 
GPD 的诊断检验图 

对于 （7.31) 式、 (7.32) 式以及 (7.33) 式的 GPD 的条件分布.我们有 

ny)- HV) . r (r s 

1 _ / P ( Tf ) G ”物 )(』)， 

〔中 . v _x + r /, x >0. 如果我们通过经验 cdf 来估计收益率的累积分布函数 F ( 7 ,), 


其中 W 
则 


户⑼ 


T - Nr , 

~T ~ 


0.2 0.3 


4以对数 尺度） 


50 ion 150 201) 250 300 
序列 



1(N 则 
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其中％是超越门限的次数， r 是样本容量.因此 

Fiy ) =尸(”)+ 邮)[1 - F ( r /)] 

T L 必 (”） J 

这就引出 / VaR 计算中所用到的 F ( y ) 的分位数的另一种估计.特别地，对于上尾 
概率 p , 其中0 < p < 0.05, 令 (/ = 1 - p . 则 F 0/) 的 g 分位数 VaR , 可以由下式估计 

VaR ^ rz - f ^ jl - (7.39) 

其中，如前面一样 r ； 是门限， T 是样本容量， AT ,, 是超越门限的次数， GPD 的刻度参 
数和形状参数分别为训…和 fc . 在 S - plus 中正是用此种方法计算 VaR 的. 

与 VhR 有关的另外-个经常用的风险度量是期望不足 (tiXjJiicUnl . sliortrall , ES ). 
它定义为超过 VaR 后的期望损失.特别地，对于给定概率 </( 具体地， 0.95 < ^ ^ 1), 
期望不足定义为 

ES , - E ( r|r > VaR .,) - VaR , + E(r — VaRJr > VaR ^). (7.40) 

利用 GPD 的性质，可以证明 

E(r - VaR ,| r > VaR ,) =拠二 fe ( V :K 
上式中 0 > fc > -1. 因此, 我们有 

VaR 9 , 抑 f)- ㈣ 

E ^ = TTk + ~rnr- 

为了说明计算 VaR 和 ES 的新方法，我们仍然应用 IBM 股票的负日对数收益 

寧，且其门限为2.5%. S - P ： us 命令为 
riskmeasures: 

> riskmeasures(nibm.gpd # c(0.95,0.99)) 
p quantile sfall 

【 1,1 0.95 0.02208893 0.03162723 
[2,1 0.99 0.03616619 0.05075763 

从输出结果来看，对于尾概率 0.05 和 0.01, 金融头寸的 VaR 值分别为$220 889 
和$3«1 (561. 这两个值与例 7.8 给出的值非常靠近.例 7.8 的结果基于前一小节所 
给出的方法得到.对于尾概率 0.05 和 0.01, 金融头寸的 ES 分别是$3〗6 272和 
$507 576. 
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7.7.6 解 释变量的使用 

前面讨论的二维泊松模型是齐次的，因为三个参数 (3 随时间不交.实 
际中，这种模型可能并不充分.此外，通常要利用一些能够影晌对数收益率 r , 的解 
释变量.新的极值理论方法对 VaR 计算的一个奵的特性足它能很容易地将解释变 
量考虑进來.本小节将讨论这样个考虑解释变量的框架.另外，我们也 W 论可以 
用來检验所拟合的二元泊松模型充分性的方法. 

假定 a ：, = ( ar lt , ••- ，:是 v 个解释变量的向量，在时刻 f 以前就可以得到. 
对资产收益率•第3章 i 、 j 论的 n 的波动率 rrf 是一个解释 变量的 例子.美国证券 
市场上解释变最的另一个例子是表示联邦公开巾场委员会 （Federal Open Market 
Committee ) 会议的示性变量.利用解释变量的一个简单方法是猜想三个参数 A -, o 
和0是时变的，而且是解释变量的线性函数.具体地，当解释变量;^可以得到时， 
我们假定 

心= 70 + l\xu H -+ ^ v x vt 三 7 o + 

ln(cift) = <?o + •. • + S v x v t = <5[| -f - <5 、， (7.41) 

0 t = + OiXu + • • • + 0 v:vt 三沒 0 + G ’ Xi . 

如果 7 = 0. 则形状参数 = 7 Q ， 且它是随时间不变的.这样，检验7的显著性可 
以提供关于解释变量对形状参数的贡献的信息.类似的方法可以运用到尺度参数和 
位置参 数中. 在方程 （7.41) 中，我们对所有的三个参数匕， ln ( tt ,) 和汉都使用了同 
样的解释变量.在应用时，不同的参数可以使用不同的解释变量. 

当极值理论的二个参数是时变的时候，我们得到一个非齐次的泊松过程.强度 
测度变为 


A[( Di ,Z> 2 ) X (r, 30 )] 


[?2 一 




kt ( r - p t ) 


D \ at 

超出时间点和收益率 {(< t ,r t> )} 的似然函数变为 

广” 1 \ 

^ = II Ti 9( rt ,-, kt ,, at , ，/ 3 tl ) x exp 


l / k t 


+ 


> V- 


(7.42) 


D 


S ( rf ； k ti a t ,/3 t )dt 


如果假定参数和饵在每个交易 H 内是固定的，其中和 S ( ry , kt , 
ccuPt ) 分别由方程 (7.36) 和 (7.35) 给出，则似然函数简化为 




L 




x exp 


1 T 

kt , a t ,/3 t ) 


(7.43) 


对给定的观测值且基本的时间间隔为 D , 门限为％方程 
(7.41) 的参数可以通过最大化方程 (7.43) 的对数似然函数来估计.这里再一次使用 
了 ln(a t ) 来满足为正的限制. 
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注释：从三个参数都是时刻/时可以得到信息的精确函数这个意义上讲.方 
程 (7.41) 的参数化类似于第 3 章中波动率模型的参数化.如果有必要也可以使用 
其他函数. 口 

7.7.7 模型检验 

对超越次数和超出量检验的二维泊松过程模型进行检验涉及检验模型的三个 
重要性质.第一个性质证明超越率的充分性；第二个性质检验超越的分布；最后一 
个性质检验模型的独立性假设.我们主要讨论在检验这三个性质时有用的一些统 
计景.这些统计量基于一些基本的、与分布和随机过程相关的统计理论. 

超越率 

一维泊松过程的一个基本性质是接连的两个事件之间的时间持续期是独立的 
且都服从指数分布.为了采用检验一个二维过程模型的类似性质， Smith 和 Shively 
(1995) 提出了研究接连的两个超越间的时间持续期.如果这个二维的泊松过程模型 
对超越次数和超越量是恰当的，则第 i 个超越与第 i _ 1个超越之间的时间持续期 
应该服从一个指数分布.更具体地.令4 = 0,我们期望 

< 1 

2e , = —. 9 ( 77 ; fc a , a 8 ,/? a ) d . s , i = l ，2, … 

u 

是独立同分布 （ U . d .) 的.且均服从一个标准指数分布.因为日收益率是离散时间的 
观测值.我们采用的时间持续期为 

I “ 

zt . = ^ 5 Z S { r ]\ k t } a u ^ t ), (7.44) 

4*1 

并利用分位数-分位数 ( QQ ) 图来检验独立同分布标准指数分布的有效性.如果模 
型是充分的，则 QQ 图应显示一条通过原点且斜率为1的直线. 

超越量的分布 

在所考虑的二维泊松过程模型下，超过门限 r / 的超越量 a = r t - V 的条件分布 
是一个形状参数为幻.尺度参数为 咖= a t - kt ( n -0,) 的广义帕累托分布 （ GPD ). 
因此，我们可以利用标准指数分布与 GPD 之间的关系，定义 

( ^ 

= < 


如果模型是充分的.则{叫,}是独立的 a 服从均值为1的指数 分布. 可参见 Smith 
(1999). 我们可以利用 QQ 图来对检验超出量 GPD 假定的有效性. 


(1 - fct. 


n. - v 
命 ti , 


若 fct . 一 0 , 


(7-45) 
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独立性 

在调整解释变量的影响以后，检验独立性假定的一个简单方法是研究^与 
w t . 的样本自相关函数.在独立性假 定下. 我们期望々，和的序列相关系数都是 
零. 

7.7.8 说明 

在本小节中，我们对 IBM 股票从 I 962 年7月3曰至1998年12月31曰以百 
分比表示的日对数收益率采用了一个二维非齐次的泊松过程模型我们集中于讨 
论持有一个1千万美元的多头头寸.该分析使我们能够与前面利用其他方法计算 
VaR 所得到的结果相比较. 

首先我们指出例 7.7 中的二维齐次模型需要进一步提炼，因为拟合的模型没能 
通过 7.7.7 节中的 模铟统 计量的检验图 7-8 a 与图 7-8 b 显示了齐次模型当门限为 
V = 2.5%时，弋和的自相关函数，其定义分别见 (7.44) ^ (7.45). 图形中的两 
个水平线表示两个标准误差的渐近上 下限. 可以 看出％ 和 „； t , 序列都有某些显著 
的序列相关性•图 7 -0 a 与图 7 Oh 显示了 ％和叫，序列的 QQ 图，每个图形中的 
直线都为理论线.它过原点并且在标准指数分布假定下斜率为1, ，的 QQ 图显 


( ft ) 齐次： 2_ ( c ) 非齐次： 2 


04 - 

0.2 - 

_ 

0.4 - 

0.2 - 


0 0 - 

1 1 1 1 . 

Ci« 




^ 1).11 _ 


-0.4 - 

n _ , ■ 

-0.4 - 



1 2 3 4 5 f. 7 S 9 |0 


1 « i i i ■ i i 學 i 

t234SG78ni() 


间隔 


间隔 


(b) 齐次 •• w 


(d) 非齐次 ： w 

0.4 - 


0.4 - 


0.2 - 

4— - - 

1),2- 


0.0 - 

[Tr : 1 III 


. 1 i 1 1 


1 l 

U.U ' 

< 

I'll ■■暑 

-0.4 - 


0.4 - 



. -1-1-1-1-1-1-1- 1 ~ r* 

1234 50789 10 1 2 3 4 5 0 7 8 9 10 


间 W 


间隔 


阁 7 -8二维非齐次泊松过程模型中的 2 和 w 序列的样本自相关函数 .（ a ) 与 （ b ) 显示对齐次 
模璀的 结果； （ c ) 与 （ d ) 显示对非齐次模型的 结采. 所用数据为 IBM 股票从1962年7 
月3曰至1998年1‘2月31日以百分比表示的、经均值修正后的口对数收益串，门限 
为 17 = 2.5%所使用的是多头金融头寸 
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( a ) 齐次: 


( c ) 非 齐次: 




exp 




1 2 


3 4 

exp 


5 6 


型的 结果； （<0 与 （ d ) 显示对非齐次模型的结果.所用数据为 IBM 股票从1062 
年7月3闩至1998年12月31 R 以百分比表示的.经均值修正后的 R 对数收 
益韦， 门限为 7 ] = 2.5%.所使用的是多头金融头寸 


示了某些不相符性. 

为/提炼模型.我们使用均值修正的对数收益率序列 

1 9190 

r? = r< ~ ft f= 9l9oE^ 

其中 r t 为百分比表示的日对数收益率，并且采用下而的解释变量. 

(1) x u ： 对10月、11月和12月的示性变量.即，如果 f 在10月、11月或12 
月，则= 1. 选择这个变量是考虑到四个季度对 IBM 日对数收益率的影响（或 
称年末效应如果这种影响效应存在的话). 

(2) x 2 t ： 对前一个交易日行为的示性变量.具体地.= 1当且仅当对数收益 
率< -2.5%.因为我们集中于讨论门限为2.5%的一个多头头寸，当价格降低 
超过2.5%时超越发生.因此，当 IBM 股票的价格相对于前一天交易日的价格降低 
2.5%或更多时，使用： r 2 t 来刻画恐慌抛售的可能性. 

(3) x 3 «： 波动率的一个定性测度，它是 /- - 1 -% < - 5( 包含 t - 1和 f - 5) 之间的 

具有超过 N 限的对数收益率的天数.在所考虑的情形下， x 3 t 是满足 | U 彡2.5%, 
; = ：!,••• ,5的 的个数. 

(4) x 4 t :年趋势， 定义为 x 4t = (时刻所在的年份- 1961)/38. 用此变童来识别 
IBM 股票极值收益率行为中的任何趋势. 
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(5) •/☆: 基于对均值修正序列 / f 的髙斯 GAIlCH ( l . l ) 模型的波动率序列.具 
体地, x 5t = %这里 a , 2 为 GARCH ( l . l ) 模型 

^ =«e» a t = er t e t , c t — A^O, 1 )， 

of = 0.045 65 + 0.080 7 a?_i + 0.903 la ^， 

的条件方差. 

这 5 个解释变量在时刻 f - 1都可以得到.我们利用两个波动率测皮（: r 3 , 与; r 5t ) 米 
研究市场波动率对 VaR 的影响.正如例 7.3 中拟合的 AR(2)-GARCH(1,1) 模型所 
显不的 • r, 中的序列相关性很弱.以至于我们不能对均值力程接受任何 ARMA 模 
型. 

利用前面的5个解释变量.并且消除+显著的参数，我们得到表 7-4 显示的估 
计结果•图 7-8 c 和 d 以及图 7-9 c 和 d 显示了当门限是 q = 2.5%时拟合的二维非 
齐次泊松过程模型的模型检验统计量 . 与叫. 的所有自相关函数都在两个标准 
误差的渐近上下限之内 . QQ 图也显示了显著的改善，尽管它们表明没有模型的充 
分性.根据检验结果，非齐次模型看上去是充分的. 

表 7-4 对 IBM 股栗从 I 962 年 7 月 3 日到 1998 年 12 月 31 日以百分比表示的 
日对数收益的二维非齐次泊松过程模型的估计结果》 


参数 

常数 

^31的系数 

X 4 f 的系数 

的系数 


门限2.5%,带334个轺越 


01 

0.320 2 


1.477 2 

2.199 1 

(标准误差） 

(0.338 7) 


(0.322 2) 

(0.245 0) 

ln ( a t ) 

-0.811 9 

0.330 5 

1.032 4 


(标袵误差） 

(0.179 8) 

(0.082 6) 

(0.201 9) 


人 f 

-0.180 5 

一 0.211 8 

-0.355 1 

0.260 2 

(标准误差） 

(0.129 0) 

(0.058 0) 

(0.150 3) 

(0.046 1) 


门限3.0%,带184个超越 


Ht 

1.156 9 



2.191 8 

(标准误差） 

(0.408 2) 



9) 

ln ( a t ) 

-0.031 6 

0.333 6 



(标准误差） 

(0.120 1) 

(0.086 1) 



kt 

-0.600 8 

一 0.248 0 


0.317 5 

(标准误差） 

(0.145 4) 

(0.073 1) 


(0.068 5) 


a 利用了文屮定义的四个解释 变莆. 此棋型坫为持冇 IBM 股票的多头头寸设定的，消除了对数收益举 
数椐的样本均值. 

考虑门限为 2.5% 的情形.估计结果说明如下几点. 

(1) 强度函数的所有 3 个参数都显著依赖于年时问趋势.特别地，形状参数有 
一个负的年趋势，表明随时间的变化. IBM 股票的日对数收益率偏离正态性越来越 
远.位置参数和尺度参数都随时间增大. 
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(2) 第 4 个季度的示性变量:与恐慌抛售的示性变量对所有的3个参数 
都是不显著的. 

(3) 受 GARCH(l.l) 模型的波动率影响的位置参数和形状参数是正的（见: r6 , 
的系 数). 这是可以理解的，因为当波动率高时，对数收益率的可变性增加了，从而 
降低了对数收益率对尾指数的依赖性. 

(4) 尺度参数和形状参数显著依赖子波动率的定性度量.估计的符号也似乎是 
合理的. 

I " 8 年 I 2 月 3 1 日的解释变量假定为 *3,9 190 = 0, x 4i g 190 = 0.973 7 ; X 5 ,9 190 - 
1-976 6. 利用这些值以及表 7 4 中拟合的模型，假定尾概率为0.05,我们得到 

^9190 = —0.01 1 95. ln(«9i9o) = 0.193 31, /3gi9o = 6.105. 

方程 (7.38) 显示的 VaR 分位数给出 VaR - 3.037 56%.因此，对一个1千万美元的 
多头头寸，我们有 

VaR = 10 000 000 x 0.030 375 6 美元= 303 756 美元. 

如果尾概率是0 01，则 VaR 为49 7 4 奶美元 • 5%的 VaR 稍高于例 7.3 中利用 
AR (2)- GARCH (1, 1) 模型给出的结果.1%的 VaR 远远高于例 7.3 情形1的结果. 
如我们所料，极值（即厚尾）对 VaR 的影响当使用的尾概率较小时更加重要. 

采用解释变量的一个优势是参数适应市场条件的变化.例如，对1998年12月 
30 日的解释变量假定的值为 .^3.9189 = 1,工4,9189 = 0.973 7, X 5 , 9 189 = 1.875 7.在这 
种情形，我们有 

^9189 = —0.250 0, ln(c» 9189 ) = 0.523 85, /3gi89 = 5.883 4. 

则95%分位数（即尾概率为13%)变为 2.691 39% . 囚此， VaR 变为 

VaR = 10 000 000 x 0.026 913 9 美元= 269 139 美元. 

如果尾概率为 （) .01，则 VaR 变为 448 32 3美元.根据这个例了，例 7.8 中显示的齐 
次泊松模型似乎低估了 VaR . 


练习题 

7.1 考虑 GE 股票从1962年7月3日至1099年12月31日的 R 对数收 益率. 此数据可以从 
CRSP 或者文件 d - ge 6299. txt 中得到.假定你持有这只股票价值 10() 万美元的多头头 
')'• 采用尾概率 U .05. 并利用下面的方法计算 I 天持有期和15天持有期的风险值 ( VaR ). 

( a ) 风险度量制方法. 

( b ) 高斯 ARMA-GARCH 模型. 

( c ) 带学生卜分布的 ARMA - GARCH 模型，这时你也需要估计自由度. 

( d ) 子区间长度为 n = 21的传统极值理论. 
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7.2 文件 d . csco 9199. txt 含有 Cisco 系统股票从1991年到1999年的口对数收益率，共 
2 275个观测值.假定你持有 Cisco 系统股票的一个价值 1()() 万美元的多头头寸.利用概 
率 P = ().01，计算你的头寸在下一个交易 R 的风险值. 

( a ) 利用风险度最制方法 

( b ) 利用带条件高斯分布的一个 GARCII 模型. 

( c ) 利用带 学生卜 分布的 GARCH 模型，你也叫能要估计自由度. 

( d ) 利用无条件样本分位数. 

( e ) 利用一个门限为2%的二维齐次泊松过程.也就是说，讨论股票円价格降低2%或更 
多的超越次数和超越量.检验拟合的模型. 

( F ) 利用一个门限为 2% 的二维非齐次泊松 过程. 解释变量为①年时间趋势，②对 1(1 
月、 11 月和 12 月的哑变 曼：③ 基于一个高斯 GARCH (1,1) 模型拟合的波动率.对 
拟合的樽型进行谂断检验. 

( g ) 利用门限2.5%和3%重复前面的二维非齐次泊松过程.评论门限的选择. 

7.3 对 Cisco 系统的日股票收益率利用 HU 1 估计以及数据 d - caco 9199. txt 估计尾指数. 

7.4 文件 d - hwp 3 dx 8099. txt 含有 Hewlett - Packard . CRSP 价值加权指数、等权重指数和 
S&P 500指数从1980年到1999年的日对数收益举.所有的收益率都以百分比表示，并 
且包含红利分布.假定感兴趣的尾概率为 0.01. 对下面的金融头才计算2000年第一个交 
易日的风险值. 

( a ) 持有100万美元的 Hewlett - Packard 股票和 U )0 万美元 S & P 50 U 指数的多头，并且 
使用风险度录制方法.对每个序列都耑要估计 IGARCH (1，1) 模型的系数. 

( b ) 与 （ a ) 舍问样的头寸，但是对每个序列利用一个一维 ARMA - GARCH 模型. 

( c ) 对持有 1()0 万美元的 Hewlett - Packard 股票的多头，利用一个二维非齐次泊松模型. 
解释变量如 下：① 年时间趋势；②对 Hewlett - Packard 股栗基于 GARCI 1 模型拟 
合的波动率，③ 4 对 S & P 500 指数基于高斯 GARCH 模型拟合的波 动率; ④对价值加 
权指数收益基于离斯 GARCH 模型拟合的波动率.对拟合的模型实施诊断检验.由 
S & P 500 指数与价值加权指数收益宇测量的市场波动率在决定 Hewlett - Packard 的 
股票收益率的尾行为卜有意义吗？你可以选择几种不同的门限. 

7.5 考虎从1980年到2003年的 Alcoa ( AA ) 股栗和 S & P 500 综合指数 ( SPX ) 的闩收益率. 
文件 d - aaspx 8003 .txt 包含简单收益率和日期数据.将简单收益率转换为对数收益率, 
并研究 Alcoa ( AA ) 股票的负日对数收益率. 

( a ) 给 Alcoa ( AA ) 股票的负对数收益率（以百分比的形式给出）拟合一般极值分布.子区 
间的长度是21个交易日.写出参数估计值及其标准误差.绘制残差的散点图和 QQ 
图. 

( b ) 当用区间长度为 21 天的 24 个子 E 间时，前面所拟合模型的收益率水平是多少？ 

( c ) 当门限为2.5%时，绘制负的对数收益甲的 QQ 图以及收益率的超额均值阐. 

( d ) 当门限为给负的对数收益举拟合厂义帕累托分布 ( GPD ). 写出参数估计值 
及其标准误差. 

( e ) 绘制以 r 图像： 

( i ) 超额分 布图； 

( ii ) 标的分布的尾部的 图像； 
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( iii ) 残差的散 点图； 

( iv ) 所拟合 GPD 的残差的 QQ 阁. 

(0 堆于所拟合的 GPD 模型.计算概率为</ = ().95, 0.99 和 0.999 时的风险值 （ VaR ) 和 
期望不足. 

7. 6 仍然考虑练习题 7.5 中的 Alcoa ( AA ) 股票的 H 对数收益率.现在我们关注的是正的日对 
数收 益率. 回答练习题 7.5 中同样的问题.然而，在拟合 GFD 模型时.使用的门限为3%. 
7 . 7 考虑 d - aaspx 8003 .txt 文件中 S & P 500 综合指数 ( SPX ) 的日收益率.将收益率转换为 
数收益率，并研宄负的日对数收益率. 

( a ) 给 S & P 500 综合指数的 负刘数 收益率（以飪分比的形式给出）拟合一般极值分布.于 
区问的 K 度是21个交易口.写山参数佔 U 值及其标准误差.绘制残差的散点图和 QQ 
图. 

( b ) 当用区间长度为21天的24个子区间时，前面所拟合模型的收益率水甲是 多少？ 

( r ) 当门限为 2 5%时，绘制负的对数收益率的 QQ 图以及收益率的超额均 值图. 

( d ) 当门限为2.5%时.给负的对数收益率拟合 GPD . 写出参数估计值及艽标准误差. 

( e ) 绘制以下 图像： 

( i ) 超额分 布图； 

( u ) 标的分布的尾部的 图像； 

( iii ) 残差的散点图； 

( iv ) 所拟合 GPD 的残差的 QQ 图. 

(0 基于所拟合的 GPD 模型，计算概率为 <7 = 0.95, 0_99和 0.999 时的风险值 （ VaR ) 和 
期望不足 (expected shortfall ). 
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近年来，经济全球化与 N 络交流己经加速了肚界金融市场的一休化.申个市场 
的价格变动能够很容易迅速地扩散到另-•个市场.因此，金融市场比以前更加相互 
依 赖了. 为了更好地理解全球金融的动态结构，必须将它们联合起来考虑.在某些 
情况下 ，一 个市场可能引导另个市场.然而在其他情形下这种犬系也可能颠倒过 
来.因此，了解市场如何相互关联在金融中相当重要.类似地，对持有多个资产的 
投资者或金融机构，资产收益率间的动态关系在决策制定的过程中起着很重要的作 
用.本章和第9章引进有用的金融计量经济学模型和力法来联合研究多元收益率 
序列.在统计文献中，这些模型和方法属于向童或多元时间序列分析 • 

多元时间序列包含多个一元时间序列作为其分量.因此. 向置与 矩阵的概念在 
多元时间序列分析中非常重要.如有必要，读者可以查阅本章中的附录 A 来了解向 
量和矩阵的一些基本运算和性质.附录 B 给出了多元正态分布的一些结果，并且 
这些结果在多元统计分析中应用很广泛（如 Johnson 和 Wichern 1998). 

令 r , = ( r u , r 2t , •• - } r kt )' 表示 Ar 个资产在时刻 f 的对数收益率，这里 a # 表示 
a 的转置.例如,一个投资者持有 IBM 、 微软公司、埃克森美孚公司、通用汽车公司 
和沃尔玛超市的股票.则他可能考虑由这些公司的日对数收益率所构成的 5 维向 
最.这里 n , 表示 IBM 股票的日对数收益， r 2 , 表示微软的，等等.再如，一个对全 
球投资感兴趣的投资者，可能考虑美国 S & P 500 指数、英国 FTSE 100 指数以及日 
木的 Nikkei 225 指数的收益率序列.这时序列是3 元的， r lf 表示 S ^ P 500 指数的收 
益率； r 2 t 表示 FTSE 100 指数的收 益率； 表示 Nikkei 225 指数的收益率本章的 
目的是研究一些计量经济模型来分析多元过程 r t . 

前几章中讨论的许多模型和方法可以直接推广为多元的情形 • 但是在有些情 
形下，这种推广需要注意一些问题.在某些情形下，需耍新的模型和方法来处理多 
个收益率之间的复杂关系.本章对这些问题的讨论强凋直观性和实 用性. 关丁多元 
时_序列分析的统计理论，读者可以参考 Liitk 印 ohl ( l " l ) 和 Reiusel (1993). 

8.1 弱平稳与交叉-相关矩阵 

考虑一个 fc 元时间序列 r t = 称序列 O 是弱平 稳的，如果 

它的一阶矩与二阶矩不随时间变化.特别地，弱平稳序列 n 的均值向量和协方差 
矩阵不随时间改变.除非明确地说明序列非平稳，我们都假定金融资产的收益序列 
是弱平稳的. 
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对一个弱平稳时间序列 n ， 其均值向量和协方差矩阵定义为 

H = E(r t ), r 0 = E[(r, - n)(r t - fi) r ], (8.1) 

这里的期望是由 r , 的联合分布对每个分量取期望得到的.均倌 / i 是由 n 的分量 
的无条件期望组成的 A : 维向量.协方差矩阵 r 0 是 A : x A * 矩阵 . r 0 的第 i 个对角线 
上的元素是〜的方差，而 r 0 的第 ( ij ) 个元素是^与&的协方差.需要用到 
其元紊时.我们记 

p _ ("1’ r 0 = ( r t j ⑼). 

8.1.1 交叉-相关矩阵 

令 z ? 表示由 r t£ (i = I ,-.- . k ) 的标准差构成的 kxk 对角矩阵.换句话说， 

D = diag | v^rn(O), …，⑼ }. 

则^的同步或延迟为0的交叉-相关矩阵定义为 

Po = [Py(O)] = D ^ToDK 
更貝体地 ，外 的第 ( t , j ) 个元素为 

⑹= 以⑼ = Co 十“， M ) 

v/r“(0)r 力 (0) Std(r it )st(i(r jt ) ’ 

它是 r 〃与以间的相关系数.在时间序列分析中，此相关系数称为共点或同步相 
关系数.因为它是两个序列在同一时刻/的相关性.很容易看出 ^(0) =印⑼， 
1 < Py (0) < 1;且 p «(0) -1, 因此， 〆 ()）是具有单位对角元素的对称 

矩阵. 

多元时间序列分析中一个重要的主题是分量序列之间的引导延迟关系 （ i ea d - 
lag ). 为此，用交叉相关矩阵来衡量时间序列之间线性依赖的强度. rt 的延迟为/ 
的交叉协方差矩阵定义为 

r < = fr»i(0] = E[(r t - n)(r t -i - M)'l ， (8.2) 

其中 M 是 n 的均值向量.因此，的第 （ i ， j ) 个元素为 r l 7 与间的协方差. 
对弱平稳序列.交叉-协方差矩阵 r ; 是/的函数，与时间指数 /. 无 k . 

r t 的延 迟为/ 的交叉 -- 相关矩阵 (lag-1 cross-correlation matrix. CCM ) 定义为 

Pi = [^<i(0] = (8.3) 

这里同前面一样， £> 是由单个序列 r it 的标准差构成对角矩阵.由定义， 

p ⑴ = r ‘i(0 = Cov(r u> r Jtt - f ) 

v / r“(())r 乃 (0) std ( r ,7) std ( r jt ) 


(8-4) 
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是 r it 与 r ^ t - t 的相关系数.当 i > 0时，此相关系数衡量了 对发生在/时刻 
以前的 rj . r - t 的线性依赖.因此.如果 Pn { l ) # 0且 Z ：> 0 ,我们就说序列在延 
迟/处引导着序列类似地， /?.„(/) 衡量了 r > 对 r , it _, 的线性依赖，并且如果 
&,(/)/ 0 R I > 0,我们就说 r , t 在延迟/处引导着序列以. (8.4) 式还表明 P “( l ) 
的对角元素恰恰为 r « 的延迟为/的自相关系数. 

根据上述讨论.我们得到当/ > 0时， 交叉相 关阵的一些重要性质.首先 ，一 
般地，对 J •，有 Pij ( l ) / Pji ( l ), 这是因为这两个相关系数衡里的是 {〜} 与 {r Jt } 
之间的不同的线性关系.因此，弓朽一般是不对称的.其次，由 Covir ^ rj ^ t )- 
Cov ( rj , t - h r lt ), 以及弱平稳性假定，我们有 

Cow (r u , rj , t - i ) = Cov(rj ， t _i ， n«) = Co \{ r jt , r i < t ^ i ) = Cov[r^, 

因此 r t ,(/) = r , i (-/). 因为 r 3 ，(- /) 为矩阵 r _, 的第 （ j , i ) 个元素，且这个等式对 
成立，所以我们有 r , = ，内 = 〆 _,.因此，与一元情形不同，对一般 
的向景时间序列来说，当/ > 0时, p , / p _,. 因为仍=乂,，所以在实际中，只考虑 
1>0 时的交叉相关矩阵仍就足够了. 

8.1.2 线性相依性 

综合起来，一个弱平稳向量时间序列的交叉相关矩阵 { P 小= 0,1， ... } 包含下 
面的信息. 

(1) 对角元素{外屬= 0，1，...}是〜的自相关函数. 

(2) 非对角元素 / v ,(0) 衡量的是 r , t 与以之间的同步线性关系 • 

(3) 对 Z > 0,非对角元素 Pij ( l ) 衡量的是 r , t 对过去值的线性依赖. 

因此，如果对所有的/ > 0,都有 p ,, ⑴= 0 .则〜并不线性地依赖于序列的任 
何过去值 

一般地.两个时间序列与{7>}之间的线性关系可以概栝如下. 

(1) 如果对于所有的 k > 0,都有 Pij ( i ) - & i(0 = 0,则〜与以没有线性关系. 

(2) 如果 & (0 ) # 0 ,则 r , t 与 r ) t 是同步相 关的. 

(3) 如果对于所有的 i > 0, 一 0且 印⑷ 一 0 ,则〜与 r jt 没有引导-延迟 
关系.这时称这两个序列是分离的. 

(4) 如果对于所有的/ > () , Pij { l ) = 0,但是对某些 I ； > 0,有 pji { v ) ^ 0,则从 
r , t 到⑺有一个单向关系.此时， r it 并不依赖于的任何过去值.但是以却依 
赖于 r it 的某些过去值. 

(5) 如果对某些/> 0, ^ 0;而且对某些 v > 0, ~⑻关0 , 则〜与 r Jt 之 

间具有一种反馈关系. 

前面陈述的条件都是充分条件.研究时间序列之_关系的更加有效的方法是对序列 
构造一个多元模型，因为-•个恰当特定的模型同时考虑，该时间序列的序列相关性 
及序列之间的交叉相关性. 




1 I I I. j • 

1940 19 G 0 1980 2( HH ) 

图 8>1 IBM 股票 （ a ) 与 S & P 500 指数 （ b ) 从 1926 年 1 月罕 If )! W 年12月的 
月对数收益率的时间图 
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8.1.3 样本交叉-相关矩阵 

给定数据 { r 小其交叉协方差矩阵 D 可以通过下式佔计 

^ (»*f r )( r t -i r )\ l > 0, (8.5) 

这里 f ^ rt / T 为样本均值向童. 交叉相 关矩阵代的估计为 

pi = D t t D \ l ^ 0 , ( 8 . 6 ) 

其中办是分量序列的样本标准差构成的 kxk 对角矩阵. 

类似于一元情形，样本交叉相关 矩阵 〆 的渐近性质在各种假定之下都已给 
予研究了.例如可以参见 Fuller (197(;，第6章).这个估计是相合的，但对于有限 
样本是有偏的.对于资产收益率序列 . &的有限样本分布相当复杂.部分原因是由 
于条件异方差与高峰度的出现.如果需要交叉相关的有限样本分布，我们建议利 
用适当的自助 ( hoot . st . rap ) 重新抽样方法得到分布的近似估计.对于许多应用而言, 
Ml ) 方差的一个粗糙估计就足够了. 

例 8 .1 考虑 IBM 股票弓 S&PSOO 指数从1926年1月至1999年12月的月对数 
收益率，共 888 个观测值.该收益率包括了红利支付.并且以百分比表示.分别用 
ru 和 r 2t 表示 IBM 股栗与 S & P 500 指数的收益率.这两个收益率组成了一个二元 
的时间序列= ( r lt , r2t /. 图 8-1 给出了同样尺度的 ？ v 的时间图.图8~2给出了 
两个序列的一些散点图.这些图像表明这两个时间序列是问步相关的.事实上，两 
个收益率之间的样本问步相关系数是 1).64, 这在5%水平下是统计显著的.然而，1 
步延迟的交叉相关若有的话也是很弱的. 


2U- 

Q ° 
- 20 - 


(1») S & P 500 指数的月对数收 益率: 192(5 年1月到 1 D 99 年12月 


( k ) IBM 股票的月对数收 益率： I 9 fi 2 年1月到1999年12月 
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-30 _20 -10 0 10 2() 30 -20 0 20 

ibml spl 


8-2 IBM 股票与 S & P 500 指数的月对数收益率的一些散点阁， ( a ) IRM 股票与 S ^. Pr > n () 
指数的同步图： （ h ) S ^ P 500 对延迟1步的 IBM : ( c ) IBM 对延迟1步的 S&P 500; 
( d ) S & P 500 对延迟 1 步的 S & P 500 

表给出/两个序列的一些概括性统计量与夂叉相关矩阵.对一个一元序 
列，每个 CCM 都是一个 2 x 2 矩阵，包含4个相关系数.实址经验表明很难同时吸 
收许多的交叉相关矩阵，尤其是当维数大于3时.为了克服这个困难.我们利 
用 Tiao 和 Box (1981) 的简化记号，并且定义一个简单的交叉相关矩阵，它包含三 
个符号“+”，“一”和其中 

(1) “+”意味着相应的相关系数大于或等于 2/ v / T ； 

(2) 意味着相应的相关系数小于或等于 - 

(3) 意味着相应的相关系数介于 -2/ v /5" 与 2/ vT 之间. 

此处 2/ VT 是假定 r t 为一个白噪声时，在 5% 渐近水平下样本相关系数的临界值. 

表 8-1(： 给山了 IBM 股票与 S & P 500 指数的月对数收益率的简化 CCM . 很容 
易呑出在 5% 渐近水平丄显著的交叉相关主要出现在延迟 1 和延迟 3 处. 检査这 
两个延迟的样本 CCM 可见 ： （ a ) S & P 500 指数的收益率在延迟 1 与延迟 3 处有某 
些边际自相关性； （ b ) IBM 股票收益率刘 S & P 500 指数的过去收益率的依赖关系很 
弱.后一观测是根据夂叉-相关在延迟 1 与延迟 3 处的 CCM 的第 (1,2) 个元素的 
显著性. 

图 8*3 显示了两个序列的样本自相关与样本交叉相关.对延迟为0的 ACF 而 
言是对称的.我们只给出了具有正的延迟值的 ACF . 因为使用 S & P 500 指数收益率 
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图 8-3 两个月对数收益率的样本自相关和 交叉相 关函数： （ a ) IBM 股票收益率的样本 ACF ; 
( b ) S & P 500 指数收益率的样本 ACF ; ( c ) IBM 的收益举和 S & P 500 指数收益率的延 
迟值的交义相关系数 


表 8~1 IBM 股票和 S & P 500 指数的月对数收益率的概括性统计量和交叉-相关矩阵 
(时间段是^ 1月至年12月） 


( a ) 概栝 n 统 if-M 


M 小变动价位 

均值 

标准误差 偏度 

超额畔度 

最小值 

最人值 

IBM 

1.240 

6.729 -0.237 

1.917 

-30.37 

30.10 

S & P 5 

0.537 

5.645 -0.521 

8.117 

一 35.58 

35.22 

ib ) 交义相关矩阵 

延迟1 

延迟2 

延迟3 

延迟4 

延迟5 

0.08 0.10 

0.02 

Q .0 G -0.02 -0.07 

-0.02 

-0.03 0.00 

0.07 

0.04 00 ft 

n 02 

0.02 -0.07 -0.11 

0.04 

0,02 0.0() 

0.08 


(c) 简单记号 


的延迟值来计算交叉相关.所以图 8>3 c 中与 fH 延迟相联系的图给出了 IBM 股票收 
益率对过去的 s & pr , nn 指数收益率的依 赖性； 与负延迟相联系的图给出了 s & pr,oo 
指数收益率对过去的 IBM 股票收益率的线性依赖性.图中的水平线是样本自相关 
弓样本交叉相关系数的 两个渐 近标准差的上下限.从图中可以看出， 两个 收益丰 
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图 8* 4 关国政府债券的月简盘收益率的时间图，期限分别是 （ a ) 30年 期限； （ b ) 20年 期限； 

( c ) 10年 期限； （ d ) 5 年 期限； （ e ) 1 年期限.样本时间段是1942年1月至1999年 
12月 

例 8 . 2 考虑期限分别为 3 <]年、 2 0年 . 10年 ， 5年和1年的美国政府债奍指数的 
月简争收益宇.数据来自于 CRSP 数据库，样本期间为1942年1月至1999年12 
月，共 696 个观测值.令 n , rt ) t y 为具有递减的剩余期限的收益率序列. 

图 8 - 4 给出了同样尺寸的 r , 的时间图 . 1年债券收益率的可变性远远小于较长期 
限的收益率的可变性.数据的样本均值和标准差分别为 

A = 10~ 2 (0.43, 0.45,0.45,0.46, 0.44) , } 

<t = 1()' 2 (2.53, 2.43, 1 .97, 1 .39, 
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之间的动态关系非常弱，但是它们的同步相关却是统计显著的. 
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序列的同步相关矩阵为 
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1.00 

0.98 

0.92 

0.85 

0.63 


0.98 

1.00 

0.91 

0.86 

0.64 

Pn = 

0.92 

0.91 

1.00 

0.90 

0.68 


0.85 

【).86 

0.90 

1.00 

0.82 


0.63 

0.64 

0.68 

0.82 

1.00 


出现下列现 象并不奇怪： 

( a ) 序列有高度的同步相 关性； 

( b ) K 期债券之间的相关耍 高丁短 期债券之间的相关. 

表心2给出了 r , 的延迟为1处与延迟为2处的交叉相关矩阵以及相应的简 
化矩阵.绝大多数显著的交叉相关在延迟1处.而且5个收益序列看上去是交互 
相关的.另外 . 1年期债券收益率的延迟为1处与延迟为2处的样本 ACF 髙于其 
他较长期限序列的相应延迟的 ACF . 


表8~2 美国政府愤券的5个指数的月简单收益率的祥本交叉-相关矩阵.时间段是1942 
年1月至1999年12月 

延迟1 I 延迟2 


夂又相关矩阵 


0.10 

0.08 

0.11 

0.12 

0.16 

0.01 

0.00 

0.00 

-0.03 

0.03 

0.10 

0.08 

0.12 

0.14 

0.17 

-0.01 

0.00 

0.00 

-0.04 

0.02 

0.09 

0.08 

0.09 

0.13 

0.18 

0.01 

0.01 

0.01 

-0.02 

0.07 

0.14 

0.12 

0.15 

0.14 

0.22 

-0.02 

-0.01 

0.00 

-0.04 

0.07 

0.17 

U.15 

0/21 

0.22 

U.4U 

-0.02 

0.00 

0.02 

0.02 

0.22 


简化的交叉相关矩阵 



8.1.4 多元混成检验 

Hosking (1980, 1981) 以及 Li 和 McLeod (1981) 己经把一元的 Ljung-Box 统 
计量 Q ( w ) 推广到了多元情形.对一个多元序列，检验统计量的零假设为: 
p { = . . . = p m = 0. 备择假设为:对某些； G {1, •• - , m }, p , ^ 0. 这样，就利用 
这个统计量来检验向量序列 r , 没有自相关或交叉相关性.假定检验统计量具有如 
下形式 m 

Qk ( m ) = (8.7) 

其中 r 为样本容量，为的维数; tr ( A ) 是矩阵4的迹，即 A 的对角线元素的 
和.在零假设以及一些正则条件下. Q k ( m ) 渐近服从一个自由度为 AAn 的 x 2 分布. 
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注释： Q k ( m ) 统计量可以根据样本交叉相关矩阵&改写.但是这种表示涉 
及 Kroiiecker 积 ® 与本章附录 A 讨论的矩阵的向量化.利用这些算子，我们有 

Qk(m) = T^^—MpE^Po 1 )^ 

其中 bi = vec ( h ). Li 和 Mcleod (1981) 提出的检验统计量为 

Qk(m) = rf ； b ； (p 0 - l ®p 0 - i )6z+ A:2m( 2 ; 1 ° ， 

i=i 


它渐近等价于 Q k ( m ). □ 

对例 8.1 中的 IBM 股票与 S & P 500 指数的二元月对数收益率应用 （^( m ) 统 
计最，我们有 g 2 (l) =9.81, Q 2 (5) = 47.06. g 2 (10) = 71.65. 根据自由度为4, 20和 
40的渐近 x 2 分布.可得到这些 Q a ( m ) 统 汁量的 p 值分别为 （1.044, 0.001 和 0.002. 
因此，混成检验进一步确认了在5%的显著性水平下该二元收益率序列存在序列依 
赖性.对于例 8.2 中债券指数的5元月简单收益率，我们有 Q 5 (5) = 1 065.63,与自 
由度为125的 x 2 分布相比较，它是髙度显著的. 

Qk ( m ) 统计量是对的前 m 个交叉相关矩阵的个联合检验.如果零假设 
被拒绝.那么我们必须对序列建立一个多兀模型来研究序列分量之间的引导延迟 
关系.下面我们 W 论一些简单的向 M 模型.它们在给多元金融 B 、] 间序列的线性动态 
结构建模时很有用. 


8.2 向量自回归模型 

在给资产收益率建模时，一个简单有用的向量模型是向量自回归 (vector au ¬ 
toregressive , 简记为 VAR ) 模型.称多元时间序列 r , 服从一个一阶的 VAR 过程. 
或者简单地称为 VAil ( l ), 如果它服从下面的模型 

n = 0u + ^r t -i + a t , (8.8) 

这里如是一个维向量 . 4是一个& x 矩阵. {«,} 是一个序列不相关的随机向 
量序列，其均值为0,协方差矩阵为 S . 实际应用中，要求协方差矩阵 S 是正 定的: 
否则.可以简化 r t 的维数.文献中，通常假定&是多元正态的. 

考虑二兀情形 1 即 k — 2, r , = (rit ， r2t)' 且 a! = (^ 仏吻 )’】. 这时 VAR(l) 模型 
包含了下面两个 方程： 


r\t =冶 io + 中 lin.t— 1 + + an, 


^2t = 办 20 + 中 2l7 ， l ， t-1 + ^22^2,e-I + (l 2 t, 
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其中步,，是中的第 （ i ， J ) 个元素.也0是如的第 i 个元素.根据第一个方程，少 12 
表示的是在存在时 . r lf 对 r 2 . t _! 的线性依赖.因此0 12 为给定 Rt , 
r 2 , t _, 对 r lt 的条件效应.如果0 12 = 0,那么 r u 并不依赖于而且模型表 
明只依赖于它自己的过去值.类似地，如果 步 21 = U , 那么第二个方程表明了给 
定 r 2 . t - i 时,〜并不依赖于 

联合考虑这两个方程. 如果％ 2 = 0,但是 0 21 # 0,那么从 r lt 到 r 2 t 有--个单 
向关系.如果0 12 =知= 0,那么 r u 与是分离的.如果少, 2 _0,且 步 21 ^0. 
那么这两个序列之间有一个反馈关系. 

8.2.1 简化形式和结构形式 

—般地， (8.8) 式的系数矩阵办度量了 的动态相依性 . n , 与 r 2t 之间的同步 
关系可以通过 a , 的自协方差矩阵27的非对角线元素 a 12 来反映.如果 a 12 = 0,那 
么这两个分量序列之间没有同步线性关系.在计量经济文献中. (8.8) 式中的 VAR ( l ) 
模型称 为简化形式的 模型，因为它没有清楚地给出分量序列之间的同步相依性.如 
果有必要.我们可以通过对简化形式的模型作一个简单的线性变换得到包含同步关 
系的一个显式表达.因为 r 是 m 定的，所以存在一个对角线上元素全为1的下三 
角矩阵 L 以及对角矩阵 r ； 满足 X = LGL '. 参见附录 A 中的 a . olc-sky 分解因 
此， L " 1 S ( L / )- 1 - G . 

定义 b t = I _1 a 卜则 

E{b t ) = L ~ l E ( a t )=0, Cov(b,) = L _1 E(L = L -1 E(L , )- 1 = G . 


因为 G 是对角矩阵，所以卜的分量是不相关的.在 (8.8) 式中的两端同时左乘 
L - 1 , 我们得到 

L~ l rt = + -f L~ l u t = «/»o *f + b t . (8.9) 

其中批 = L ~ l < ti Q 是一个 A : 维向量，而且中 * = L - 1 办是 fc x it 矩阵因为这个特 
殊的矩阵结构， IT 1 的第 A * 行具有形式（叫 nun , …， m ， l ). 因此.模型 (8.9) 
的第个方程为 


rki 4- ^2 tukiru = + ^2 ^ ki r i . t-i f (8.10) 

1=1 1=1 

这里 01, 是％的第 A : 个元素，中 L 是中‘的第 ( k ， i ) 个元素.因为对 1 < i < fc . 
b k , 与 b : t 是不相关的，所以 (8.10) 式明确给出了 对 r , t 的同沙线性依赖性.其 
中1 < i < A : - 1. 在计量经济文献中，该式称为 r fc < 的一个结构方程. 

对 r , 的任何其他分量我们可以对 VAR ( l ) 模型进行重排，使得 r it 变为 
r f 的最后一个分量.可以利用前面的变换方法来得到~的一个结构方程.因此, 
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(8.8) 式的简化形式的模型等价于计童文献中使用的结构 形式. 在时间序列分析中， 
通常使用简化形式的模型，原因有 两个： 第一个原因是易于 估计; 第二个.也是主要 
的原因，是在预测时不能用同步相关性. 

例 8 . 3 为了说明从简化形式模型到结构方程的变换，考虑二元 AR (1) 模型 


， it 
>2 t 


0.2 

0.4 


0.2 0.3 
- 0.6 1.1 


n ， f-i 

r 2， t-l 


对这个特殊的自协方差矩阵 s , 下三角矩阵 


aif 

U 2 t 



1.0 0 .() 
-0.5 1.0 


给出个 Cholesky 分解（即是一个对角阵).将前而的二元 AR ⑴ 
模型左乘上因子 L - 1 ，我们得到 


1.0 0.0 
-0.5 1.0 


nt 


' 0.2 ' 

Tit 


0.3 


0.2 0.3 
-0.7 0.95 


^ 2,^-1 



2 0 
0 0.5 


这里 G = Cov ( b t ). 这个变换模型的第二个方程为 



ht 


r 'H =0.3 + 0.5 r “ — 0.7 ri f t _| + 0.95t - 2,(— i + &2 t . 


该方程明确给出了〜对的线性依赖. 

重新安排 r , 中元素的顺序.则二元 AR (1) 模铟变为 


T 2 t 


1).4 

_L 

1.1 

-0.6 

ru 


0.2 

卞 

0.3 

0.2 


7*2,t- 1 

n , t-i 


0 .H 

(in 


在 S 的 Cholesky 分解中需要的下三角矩阵变为 



2 


J _ 1.0 0.0 

— - 1.0 1.0 

将前面重排的 VAR ( l ) 模型前乘以 L 1 . 我们得到 


1.0 0.0 

- 1.0 1.0 


T 2 t 

r\t 


0.4 

- 0.2 


- 0.6 1.1 

- 0.8 0.8 


n,t-i 


Cu 

C2t 
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其中 G = Cov ( ct ). 现在第二个方程给出 

r*it = —0.2 4- 1.0r2 / — 0.8r2,t—i + 0.8r^ t t_i + C2t- 

这个方程再一次明确给山了 r lt 对❿的同步线性依赖性. 

8.2.2 VAR ( l ) 模型的平稳性条件和矩 

假定 (8.8) 式中的 VAR ( l ) 模型是弱平稳的.对这个模型取期望，利用 E ( n l ) = 
0 , 我们得到 

E(r t ) - 泠 0 + 抓 (rt—i). 

因为 E ( r ( ) 不随时间变化，假定矩阵/-^是非奇异的，则我们有 

M = E(r t ) = (/- 中广 1 0 0 , 

其中 I 是 fc x fc 单位矩阵. 

利用 < A 0 - (/ - 伞以则 (8.8) 式中的 VAR ( l ) 模型可以写为 

(r t - ^)= 中 (n-i — "） + a,. 

令卜= r , - ^是均值修正的时间序列，则 VAR ( l ) 模型变为 

— t + a t . (8.11) 

这个模型可以用来推导出 VAR ( l ) 模型的性质.通过重复迭代，我们可以将 (8.11) 
式改写为 

r, = a, I ^a t _j I ^ J a t _ 2 + # 'aj-a H - . 

这个表示给出了 VAR ( l ) 过程的几个特征.第一，因为 《 t 是序列无关的.从而 
Cov ( a t , r f _ 1 ) = 0. 事实上,对所有的 f > 0 ， 叫与 rq 都是不相关的.由于这个原 
因 ，将〜 称为序列在时刻 i 的一个扰动或新息.可以证明，同一元的情形类似，对 
所有的时间序列模型，叫与过去值> 0) 是不相关的.第二，将这个表示右乘 
以 a ' t 后取期望，并利用过程 a , 的不相关性，我们得到 Cov ( r ,, a f ) = S . 第三，对 
于一个 VAR ( l ) 模型 . r , 以系数矩阵伞 7 依赖子过去的信息 a ,^. 为了这种相依性 
有 意义. 当 j -> 00时，中〃必须收敛到 0. 这意味着中的 it 个特征值的模必须都小 
于1;否则，当 j — oo 时， V 要么发散.要么会收敛到一个不为0的矩阵，事实上， 
如果 假定叫 的自协方差矩阵存在，那么要求办的所有特征值的模都小于1,这正 
是 r , 弱平稳的充分必要条件.注意到对一元 AR (1) 情形，这个平稳性条件简化为 
\<}>\ < 1- 另外，因为 

|A/- = X k . 

A 
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故*的特征根是行列式 |J - 中 B | 的零点的倒数.因此 7t 平稳的一个等价的充要 
条件是行列式 i 中 m 的所有零点的模都大于〗，即 | 中(石)|的所有零点在复平面上 
都位亍单位圆外.第四，利用这个表示，我们有 


Cov(r f ) = r „ = s + 中 ' + 伞 2 s ( 中 2 )' + ... = ^2 (中 

i =：0 

其中中"=/, gp A ： x A ： 单位阵. 

将 (8.11) 式两端右乘以汽_,后取期望，并利用对千 j > 0,有 Cnv ( n tl r ( j ) = 
E ( a t r , ,_ j ) = 0 的结果，我们得到 

e ( o 抓 m / >0. 

因此 

17/ = ^Vi^i I > 0, (8.12) 

其中 r ； 是巧的延迟为 j 的交叉协方差矩阵.这个结果又是一元 AR ( i ) 过程的 
—个推广. 

通过重复迭代. (8.12) 式 表明： 


r ；= 中 ’ r 0 , z > o . 

在 (8.12) 式两端分别左乘 D — 讲 再右乘 D - V 2 可以得到 


p t = D 1/2 ^^_!£)- ,/2 = D-^^D^^D^Ti-xD-^ 2 = Tp,_ lf 
其中 T = D ^^D l/2 . 因此 VAR(l) 模型的 CCM 滿足 

Pi — Po ^ / > 0 . 

8.2.3 向量 AR(p) 模型 

VAR(l) 模型可以直接推广到 VAR(p) 模型.称时间序列 r, 服从个 VAR(p) 
模型，如果它满足 


r r = -f • • • + 4»,>r t _ p 4-a r , p > 0, (8.13) 

其中％与叫如前所定义.七是 x 矩阵. 利用向后推移算子 ZJ , VAR ( p ) 模型 
可以写为 

(J - ^1 D - •P p B p )r i = (f) 0 + a t , 

其中 J 是 it x A ; 单位矩阵.这个表示可以写为一个更紧凑的形式 


= </)„ - f - a ,. 
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其中- ^> v Bv 是一个矩阵多项式.如果 r , 是弱平稳的，并假 

定逆存在，则我们有 

A* = E(r t ) = (/ - ^1- ^p)~Vo = [^(l)] _i 0o- 

令 f t = r t 一 /*， 则 VAR ( p ) 模型变为 

f t = ^ l f t _ 1 + ... + # p fi t _ p + at . (8.14) 

利用这个方程以 及弓对 VAR .(1) 模型同样的方法，我们得到 

• Cov ( r t , a Y ) = S , E 是 a * 的协方差矩阵； 

• C\)\(rt-i,ut) = 0 , / > 0 ; 

• 十 … 十中 p rz_ p , i > o. 

最后一个性质称为 VAR ( p ) 模型的矩方程.它是一兀 AR ( p ) 模型的 Y - W 方程 ( Yule - 
Walker equation ) 的多元形式.用 CCM 表示，则矩方程变为 

Pi — + …+ 丫 pPi- p ， / > 0. 

其中 Ti = D l /2 ^ iD l/2 . 

理解 (8.13) 式的这个 VAR ( p ) 模型性质的一个简单方法是利用 （8.8) 式中 
VAR ( l ) 模型的结果.可以通过将的 VAR ( p ) 模型变换为一个如元的 VAR ( l ) 
模型 得到. 具体地，令 a ;, = , r ；_ p+2 ,• • • . b , = (0，... ，0，心 '为两个 kp 

维的过程 • h 的均值是0,自协方差矩阵是一个 Jtp x 如矩阵，只有右下角的元素不 
为0,用5：表示.这样，关于 r ，的 VAR (;,) 模型可写成 

x t =^ x t - i + b t , (8.15) 

其中 f 是一个 kp x kp 矩阵： 

0 I 0 0 ... o ' 

0 0 / 0 ... 0 

伞* = :: : : : 

• * • — • ) 

0 0 0 0 … J 

也 P 企 p -1 ^ p — 2中 P - 3 ^1 

这里0 与/ 分别是 kxk 零矩阵和单位 矩阵. 文献中称中 • 为矩阵多项式伞 ( Z ?) 的 
伴随矩阵 (companion matrix ). 

(8.15) 式是关于心的一个 VAR ( l ) 模型，它包含了 r < 作为它的最后 it 个分量. 
现在可以通过 (8.15) 式用上一小节中给出的 VAR ( l ) 模型的结果来推导 VAR ( p ) 
模型的 性质. 例如，由定义，心是弱平稳的当且仅当 r t 是弱平 稳的. 因此. (8.13) 
式中 VAR ( p ) 模型弱平稳的充要条件是 (8.15) 式中伞 • 的所有特征值的模都小于 
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1. 类似于 VAR ( l ) 模型，可以证明该条件等价于行列式 \^( D )\ 的所有根都在单位 
圆外. 

在金融时间序列分析中特别关心的是 VAR ( p ) 模型的系数矩阵 A 的结构.例 
如，如果对所有的/ ,中/的第 ( ij ) 个元素 ^ j ( l ) 都是0,则 q 不依赖于的过 
去值.这样，系数矩阵知的结构给出了 r , 的分量之间的引导-延迟关系的信息. 

8.2.4 建立一个 VAR(p ) 模型 

我们继续利用定阶、估计以及模型检验这样一个迭代程序来对给定的时间序 
列建立一个向量 AR 模型. 一元序列 PACF(partial autocorrelation function , 偏自 
相关函数)的概念可以推广到多元情形并用来识别向量序列的阶 p . 考虑下面的相 
邻的 VAR 模型： 

r f = 00 十 ^in-i + 

r t = + 中 ir t _i + 伞 2 r t _2 + a <， 


r t = < l>o + + • • * + ^, r t - { + a u (8.16) 


这些模 型的参 数"了以通过普通最小二乘方法 (the ordinary least squares, 简称 OLS) 来 
估计.这在多元统计分析中称为多元线性回归估计.参见 Johnson 和 Wichorn (1998). 

对于 ( 8 . 16 ) 式的第 i 个方程.令< 1) 表示的 OLS 估计，义 ） 表示％ 的估 
计，这里上标 （0 用来表示估计是针对 VAR(i) 模型的.则残差为 

^(*) ^ i (0 ^(0 ^(0 

a ； 7 = re - 00 - r t ^i - 中 , r t 一 “ 


对7:= 

定义为 


0,残差定义为 = r ,- f , 这里的样本均值.残差的自协方差矩阵 


31 亡冲 )( W ，*> o . 


(8.17) 


为了确定阶 P ， 可以对/ = 1,2,... 依次检验零假设 H o :^ t = 0 对备择假设 Z/ a : 

/ 0 . 例如，利用 (8.16) 式中第一个方程.我们可以检验零假设:旬，0,与 
备择假设: / 0 . 检验统计量为 


M ⑴ 一卜分 (■)， 

其中 S , 的定义见 (8.17) \ A \ 表示矩阵 A 的行列式.在些正则性条件下，检 

验统计童 M ⑴渐近服从自由度为 fc 2 的 f 分布（参见 Tiao 和 Box (1981)). 
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—般地，我们利用 (8.16) 式中的第 *• 个和第 •/ - 1个方程来检验 ：中， = 0 
对 • 办， 〆 () ，也就是说检验一个 VAR ( i ) 模型对一个 VAR .(» - 1) 模型.检验统 
计量为 


M(i) 




k 



(8.18) 


M (0 渐近服从自由度为 A : 2 的 x 2 分布. 

另种选择是利用 AIC(Akaike information criterion ) 或它的变形米选择阶 p . 
假定 a t 是多兀正态的，并考虑 (8.16) 式屮的笫 i 个方程，可以用最大似然 ( maxi - 
inuni likelihood . 简称 ML ) 力法米估计这个模型.对十 AR 模型， 0 LS 估计 < 和 
%等价于（条件) ML 估计.然而 ， S 的估计之间有所 区别. S 的 ML 估计为 


私=士 E (8.19) 

VAR(i) 模型在止态假定卜的 AIC 定义为 

AIC(i)-ln(|Si|)-H^. 

对一个给定的向量时间 序列， 可以选择 AR 的阶外使它满足 AIC(p) = AIC(i), 
其中 Po 是一个预先指定的正整数. ^ ^"° 

对于 VAR(i) 模型其他可用的信息准则有 

BIC(*) = ln(|E,|)+^iM^. 

HQ(i) = lnds . i ) + y’y( r )) . 


HQ 准则是由 Hannan 和 Quinn (1979) 年提出的 • 

例 8.4 ^定例 8.1 中讨论的由 IBM 股票和 S & P 500 指数的月对数收益率所 

构成的二元序列服从一个 VAR 模型.我们对数据利用 M ⑷统计量和 AIC . 表8~3 
给出了这些统计量的值.两个统计董都表明 VAR (3) 模型对数据可能是充分的•在 
5%水平下， A /( i ) 统计量在延迟 1. a , 5处都是边际显著的 . AIC 的最小值在阶3处 
出现.对这个特例 . M ( i ) 统计量在1%水平下是不显著的，从而证实了前面的 观测: 
两个收益率序列之间的动态序列相依性很弱. 


表8~3 IBM 股索和 S & P 500 指数的月对数收益李的定阶统计置， 
时间区间从 i 92 6 年1月到1999年12月 * 


阶 1 

2 

3 

4 

5 

6 

M(i) 

9.81 

8.93 

12.57 


9.56 

2.8U 

AIC 

6.757 

6.756 

7.7.^ 

6 753 

6.751 

6.756 


» 自由度为 4 的片方分布的 5% 和 1% 临界值分別为 9.5 和 1.H 3. 
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估计和模型检验 

对子一个指定的 VAR 模型.可以利用普通最小二乘法或最大似然方法来估计 
参数.这两个方法是渐近等价的.在一些正则性条件下，估计是渐近正态的参见 
Rcinscl (1993). 应该对所拟合模型的任何可能存在的不充分性进行仔细检验.可以 
对残差序列利用 Q k ( m .) 统计量来检验残差之间没有序列相关或 交叉相 关的假定. 
对一个拟合的 VAR(p) 模型，残差的 Q k ( m ) 统计量渐近服从自由度为 A: 2 m-g 的 
X 2 分布，这里 . y 为 AR 系数矩阵中待估参数的个数. 

例 8.4( 续） 表 8-4 a 给出了对丁- IBM 股票和 S & P 500 指数的月对数收益率所构 
成的二元序列拟合 VAR (3) 模型时 的估计 结果.具体指定的模型以下面的形式给 
出： 

rt = (f>i) + -f + a t , (8.20) 

其中 r , 的第一分量表示 rBM 股票的收益率.对这个特例，我们仅仅使用了延迟1 
和延迟3的 AR 系数矩阵.这是因为数据之间的弱序列相关性.一般地，当 M(i) 
统计量和 AIC 准则指定一个 VAR(3) 模型时，应该使用所有的 3 个 AR 延迟•表 
8-4b 给出了估计结果.在该结果中已经将一些统计上不显著的参数设置为 0 .另 
外，表 8-4b 给出了所拟合模型的残差序列的 Q fc (m) 统计量值为 Q 2 (4) = 18.17, 
Q 2 (8) =41.26. 因为拟合的 VAR ⑶模型在 AR 系数矩阵中具有 4 个参数，所以这 
两个 Q.(m) 统计量分别渐近服从自由度为 12 和 28 的 x 2 分布.检验的 p 值分别 
为 0.111 和 0.051, 因此在 5% 的显著性水平下，模型是充分的.如同一元分析中显 
示的，收益率序列很可能貝有条件异方差性.我们在第10章中将讨论多元波动率. 

表 8-4 对由 IBM 股票和标准普尔 500 指数 的月对 数收益 率拟合 VAR.(3) 模型时的估计 


结果，时间区间从1926年1月到1999年12月 


参数 

♦0 

中I 

中 3 


(a) 植个模型 

估计值 

1.20 

0.U11 

U.I08 

0.039 

-0.112 

44.44 

23.51 


0.58 

—0.013 

0.084 

0.007 

-0.105 

23.51 

31.29 

标准差 

0.23 

0.043 

0.051 

0.044 

0.052 




0.19 

0.036 

0.043 

0.037 

0.044 






⑼简1 

叱的模哦 

估计值 

1.24 

0 

0.117 

0 

-0.083 

44.48 

•23.51 


0.G7 

0 

0.073 

0 

0.109 

23.51 

31.29 

标准差 

D.23 


0.040 

一 

0.040 




0.19 


0.033 


0.033 




从表 8-4 b 中拟合的模型.我们观测到 ： （ a ) 两个新息序列之间的问步相关系数 
为 23.51 /\/44.48 x 31.29 = 0.03, 如所料想，它很接近于 r u 与 r 2< 之间的枰本相关 
系数； （ b ) 两个对数收益率序列具有正的显著的均值，蕴涵 f 两个序列的对数价格 
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在该数据范围内具有上升 趋势； （ c ) 这个模型表明 


IBM , = 1.24+ 0.11731^4 - 0.083 SP 5 t _ 3 + a u , 
SP 5 t = 0.57 + 0.073 SP 5 t _i - 0.109 SP 5 t _ 3 + a 2t . 


因此在5%显著水平下从 S & P 500 指数的月收益率到 IBM 的月收益率有一个单向 
动态 关系. 如果 S & P 500 指数代表美国股票市场.则 IBM 收益率将受该市场过去 
运动的影响. 然而. 即使两个收益率有实质上的同步相大性 . IBM 股票收益率的过 
去运动也并不显著地影响美国股票市场.最后，拟合的模型可以写为 


IBM t 

SP 5 t 


1.24 

0.57 


0.117 

0.073 


SP 5 卜！ 一 


0.083 


0.109 


这表不 SP 5( i 是该二兀序列的驱动因了- (driven factor ). 

预测 


SP5t_a + 


0-2t 


将合理建立的模型看作是真实的模型，则可以应用一元分析中同样的方法来进 
行预测并得到相应预测误差的标 准差. 对一个 VAR ( p ) 模型，以 /». 为预测原点的1 
步向前预测为 r ^ l )= = 相应的预测误差为以⑴= a ^ +t . 预测误 

差的协方差矩阵为 S . 对于!^前两步预测•用 r h + l 的预测束代替 r h+i 即可得到 

P 

rh(2) = </) 0 + 中 irjl) + ^2 

»=i 

相应的预测误差为 


e/i(2) = a/ l+2 + ^i[r ( — r/,(l)] = 0/» +2 + 中 

预测误差的协方差矩阵为 S + 中,！：中' i .如果 r , 是弱平稳的，则随着预测步长/的 
增加，向前/步预测 r h ( l ) 将收敛到均倌向量预测误差的协方差矩阵收敛到 r , 
的协方差矩阵. 

表 S - S 给出了 IBM 股票和 S & P 500 指数月对数收益率（以百分比形式给出）的 
向前一步预测和向前六步预测的结果，预测原点为= 888. 预测是通过表士4中 
改进后的 VAR (3) 模型得到的. 


表 S -5 对 IBM 股票和标准普尔500指数的月对数收益率（以百分比形式 给出） 利用所 
拟合的 VAR (3) 模型进行预测的 结果： 预测原点是1999年12月 


步 长 

1 

2 

3 

4 

5 

6 

IBM 的预测值 

1.40 

1.12 

0.82 

1.21 

1.27 

1.31 

标准卷 

G.G7 

0.70 

6.70 

6.72 

(5.72 

6.72 

S&P 的预删侑 

0.32 

0.38 

-0.02 

0.53 

0.56 

0.61 


5.59 

5.61 

5.61 

5.64 

6.64 

5.64 
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总之.建立一个 VAR 模型涉及三个步骤： （ a ) 利用检验统计量 M { i ) 或某种信 
息准则定阶•， Oi ) 利用最小二乘法估计指定的模型，如有必要.可以通过消除统计上 
不显著的参数来東新估计这个 模型; （ c ) 利用残差的 Q ,( m ) 统计量来检验拟合模型 
的充分件.残差序列的其他特征，如条件异方差和异常值，也可以检验.如果拟合 
的模型是充分的.则可以用它来进行预测并对变量之间的动态关系作推断. 

本小节用 SCA 进行 分析. 所用的命令包括 miden , rntsm , mest 和 mfore , 其 
中前缀 m 表示多元.下面给出了命令和输出结果的 细节. 

SCA 演示 

输出结果，其中“％”表示注释. 

input ibm,sp5. file f m-ibmspln.txt* 

-- % Order selection 
miden ibm,spb. no ccm. arfits 1 to 6. 

TIME PERIOD ANALYZED.1 TO 888 

SERIES NAME MEAN STD. ERROR 

1 IBM 1.2402 6.7249 

2 SP5 0.5372 5.6415 

========= STEPWISE AUTOREGRESSION SUMMARY ====== 



T 

RRSinTTAIi 

I 

F.TGENVAL. 

I 

CHI-SQ 

I 


I 

SIGN. 

LAG 

I 

VARIANCESI 

OF SIGMA 

I 

TEST 

I 

AIC 

I 



— 

. 十 - 


-f- 


+ - 




+ - 

— 

— 

1 

I 

•447E+02 

I 

•135E 十 02 

I 

9.81 

I 

6.757 

I 

* 

♦ 


I 

.318F.+02 

I 

.629E+02 

I 


I 


I 

• 

• 

— 

• + • 




-+ • 




-+• 

— 

— 

2 

I 

•443E+02 

I 

•135E+02 

I 

8.93 

I 

6.756 

I 

+ 

- 


I 

•317E+02 

I 

•625E 十 02 

I 


I 


I 

• 

• 

———- 





• + 




• + 

— 

— 

3 

I 

•441E+02 

I 

.134E+02 

I 

12,57 

I 

6.750 

I 

• 

■ 


I 

•313E+02 

I 

•619E+02 

I 


I 


I 

• 

- 

———■ 



- + ■ 


■•十 




-十 

— 


4 

T 

.441E+02 

I 

.133E+02 

I 

6.08 

I 

6.753 

I 

• 

• 


I 

•312E+02 

I 

•619E+02 

I 


I 


I 

• 

• 

——• ■ 

• + 


-+ 


• + 




-+ 

— 

— 

5 

I 

.437E^02 

I 

.133E+02 

I 

9.56 

I 

6.751 

I 


十 


I 

.309E+02 

I 

.613E+02 

I 


I 


I 

- 

+ 

———■ 



-+ 


-+ 





— 

— 

6 

I 

•437E+02 

I 

•133E+02 

I 

2.80 

I 

6.756 

I 

• 

. 


I 

.308Ei02 

I 

.613E+02 

I 


I 


I 

• 

• 


CHI-SQUARED CRITICAL VALUES WITH 4 DEGREES OF FREEDOM ARE 
5 PERCENT: y.b 1 PERCENT : 13.3 

-- % Specify a VAR(3) model with lags 1 & 3 only, 
rntsm fitl. series ibm, sp5. @ 
model (i-pl*b-p3*b**3)series=c+noise. 
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SUMMARY 

FOR 

MULTIVARIATE 

ARMA MODEL 

― FIT1 

PARAMETER 

FACTOR 

ORDER 

CONSTRAINT 

1 

C 

CONSTANT 

0 

CC 

2 

PI 

REG AR 

1 

CPI 

3 

P3 

REG AR 

3 

CP3 


-- % Perform mulLivariace estimation 
mestiin f itl. hold resi (rl, r2) 

- CONSTANT VECTOR (STD ERROR) - 

1.201 ( 0.232 ) 

0.583 ( 0.194 ) 

- PHI MATRICES - 

ESTIMATES OF PHI(1) MATRIX AND SIGNIFICANCE 
.011 .108 . + 

-.013 .084 •. 

STANDARD ERRORS 
.043 .051 

.036 .043 

ESTIMATES OP PHI(3) MATRIX AND SIGNIFICANCE 
.039 -.112 .- 

-.007 -.105 .- 

STANDARD ERRORS 

.044 .052 

.037 .044 


ERROR COVARIANCK (MATRIX 


1 2 

1 44.438125 

2 23.518578 31.287280 

-- % Set parameter to 0 

pi (1,1)=0 

pi (2,1)=0 

-- % Set constraint to fix the parameter 
cpl(l,l)=i 

cpl (2,1)=1 

p3 (1,1)=0 

p3 (2,1)=0 

cp3(1,1)=1 

cp3(2,1)=1 

mestim fitl. hold resi(rl.r2). 

- CONSTANT VECTOR (STD ERROR) - 

1*243 ( 0.226 ) 
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0.566 ( 0.190 ) 

- PHI MATRICES - 

ESTIMATES OF PHI(1) MATRIX AND SIGNIFICANCE 
,000 .117 • + 

.000 .073 - + 

STANDARD ERRORS 

-- .040 

—— . 033 

ESTIMATES OF PHI(3) MATRIX AND SIGNIFICANCE 
.000 -.083 • - 

•000 -.109 • - 

STANDARD ERRORS 

-- ,040 

— .033 


ERROR COVARIANCE MATRIX 


1 2 

1 44.482888 

2 23.506951 31.293592 

-- % Compute residual CCM 

miden rl,r2• maxi 12• 

-- % Produce 1 to 6-step ahead forecasts 
mfore fitl. nofs 6. 

8.2.5 脉冲响应函数 

类似于一元情形，一个 VAR(p) 模型可以表示为过去新息的线性函数•即 

rt —綷十 at + 中 iat-i 十 + • • • , (8.21) 

其中 t P =剛 n 这里假定中⑴的逆存在，系数矩阵中，可以由与下式中 a 
的系数相等 得到： 

(I - - ^ P B P )(J 十 屮 1 十 ^ 2 B 2 十 • ， •） =厂 

其中 J 为单位矩阵.这是^的滑动平均表示，其中系数矩阵中，为过去新息叫― 
对 r, 的影响.等价地，中，也是 a , 对未来观测的 影响. 因此通常称中，为 r t 
的脉冲响应函数.然而，由于叫的分量通常是相关的，所以对 (8.21) 式中少，分 
M 的解释不是很首观.为了帮助解释，我们可利用前面的 Chole^kv 分解对新息进 
行变换，使得变换后的新息的分量不再相关.具体地，存在一个下三角矩阵 L 满 
足 S = LdJ.\ 其中 G 为对角阵目 . 1 的对角线元素均为 1( 参见 （ 8_9) 式)•令 
6, = I- 一,,则 Cov(h f ) = ^. 闵此分量 心 是不相关的. (8.21) 式可以改写为 

rt == /A + Of + 中 1 CLf—i + -2 十 • •. 

= P 十 LL 1 at + ^ \LL 1 + 中 2 H 1 a <—2 + … 

= /i + ^ 06 / 4- i 4-少+ • • • ， 


( 8 . 22 ) 
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其中中 ;; = = ^, L . 系数矩阵 f 称为 r , 的带正交新息的脉冲响应函数. 

特別地 •中； 的第 （ i ， j ) 元％(/)是对未来观测 r ilt + l 的影响.在实际中，可以进 
一步将 TF 交的 新息卜 标准化，使得6〃 的方差为 1. 上述正交化的一个弱点是结果 
依赖于 n 中分量的顺序.特别地 .& lt = « u ，从而 a H 并没有作变换 • r *, 分量的不同 
排序会导致不同的脉冲响应函数. 

SCA 和 S - rius 都可以得到所拟合 VAR 模型的脉冲响应函数.为了演示 S-Plus 
中 VAR 模型的分析.我们仍然用例 8.1 中 IBM 股票和 S & P 500 指数的月对数收益 
率的数据.关于 S - Plus 命令的细节，可参见 Zivot 和 Wang (2003). 

S-Plus 演示 

输山结果. 

> x-matrix(scan(file-ibmspln.txt 1 ),2) % Load ddLd 

> ibm=x[l,] 

> sp5=x[2 # ] 

> y=cbind(ibm,spB) % Create a vector series 

> yl=data.frame(y) % create a data frame 

> ord.choice=VAR(yl # max.ar=6) % order selection 

> ord.choice$info 

ar(l) ar(2) ar(3) ar (4) ar(5) ar(6) 

DIC 10998.47 11016.61 11031.07 11052.05 11069.49 11093.78 

> ord.choice=VAR(yl,max• ar=6,crif.^rion= ， AICV ) 

> ord.choice$info 

ar(l) ar(2) ar(3) ar(4) ar(5) ar(6) 

AIC 10969.70 10968.79 10964.11 10965.97 10964.28 10969.44 

AIC 跟以前一样选择了 VAR (3) 模型，而 BIC 选择了 VAR ( l ) 模型.为简单起 
见，我们在演示中用 VAR ( l ) 模型. 注意到在两个程序包中用到了不同的标准化方 
法，因此信息准则的值是不同的.可参见表 8-3 中的 AIC . 这并不重要，因为标准化 
并不影响阶的选择.下面转向估计. 

> varl.fit=VAR(y-ar(1)) % Estimation 

> summary(varl.fit) 

Call ： 

VAR(formula = y - ar(1)) 

Coefficients : 

ibm spb 
(Intercept) 1.162*7 0.4993 

(std.err) 0.229G 0.1925 

(t.stat) 5.0777 2.5935 

ibm.lagl 0.0192 -0.0054 
(std.err) 0.0433 0.0364 

(t.stat) 0.4429 -0.1487 


sp5.1agl 0.1062 0.0802 

(std.err) 0.0517 0.0435 




31 C 


8 章多元时间序列分析及其应用 


(t.Stat) 2 . 0544 1 . 8454 

Regression Diagnostics : 

ibm sp5 
R-squared 0.0105 0.0058 
Adj. R-squared 0.0082 0.0036 
Resid. Scale 6.7043 5.6376 

> plot(varl.fit) 

Make a plot selection (or 0 to exit) : 

1: plot : All 

2; plot : Response and Fitted Values 
3 : plot : Residuals 

8: plot : PACF of Squared Residuals 
Selection : 3 

所拟合的模型是 

IDM ( - 1.1.6 + 0.021 BM t -i +0.11 SP 5 t ^ + a lt , 

SP5 t = 0.50 0.01IBM t _i I OmSPSt-j I a 2t . 

基于输出结果中估计的 f 统计量的值，在两个方程中都只有延迟变量 SP 5 t _! 是显 
著的.图8~5给出了两个残差序列的时间序列图.两条水平线表示两倍的标准误差 
上下限.如所料想.取值为异常值的观测存在聚集现象. 


残差与时间 

I) 200 4UU G(N) 80() 



0 200 400 QI0 H(K) 


m 8-5 为 IBM 股票和 S & P . TOQ 指数的 H 对数收益率（以百分比形式给出）所拟合的 VAIt ( l ) 
模型残差的时间序列图，样本的时间区间从1926年1月到1999年12月 

接下来，我们计算所拟合 VAR ( l ) 模型的向前1步到向前6步预测以及脉冲 
响应函数.这里 IBM 股票的收益率是 r , 的第一个分量.与表 8*5 中的 VAR (3) 模 
型相比.用 VAR ( l ) 模型得到的预测更快地收敛到序列的样本均值. 
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> varl.pred=predicc(varl.fit , n.predict=6) % Compute prediction 

> summary(varl.pred) 

Predicted Values wich Standard Errors: 

ibm spS 

1- step-ahead 1.8472 0.9255 

(std.err) 6.7043 5.6376 

2- step-ahead 1.2964 0.5636 

(std.err) 6.7394 5.6539 

3- step-ahead 1.2474 0.5375 

(std.err) 6.7397 5.6540 

6-step-ahead 1.2434 0.5356 
(std.err) 6.7397 5.6540 

> plot(varl.pred,y, n.old=l2) % Plot forecasts 

> varl.irf=impRes(varl.fit,period-6,std.err=*asymptotic*) 

> summary(varl.irf] 

Impulse Response Function : 


(with responses in rows, and innovations in columns) 

,,lag.0 

ibm sp5 
ibm 6.6929 0.0000 
(std.err) 0.15fl9 0.0000 
sp5 3.5645 4.3553 
(std.err) 0.1690 0.1034 
I • lag.1 

ibm sp5 
ibm 0.5069 0.4624 
(std.err) 0.2244 0.2249 
sp5 0.2496 0.3492 
(std.err) 0.1885 0.1891 

> plot(varl.irf) 

图 8_ 6 给出了最后 12 个数据点的点预测和置信水平为95%的预测区间.图 
8-7 给出了所拟合 VAR ( l ) 模型脉冲响应的函数图，这里 IBM 股票的收益率是 r , 
的第一个分量.由于收益率序列的动态相依性很弱，从而脉冲响应函数展现出简单 
的形式，并且快速地衰减. 

8.3 向量滑动平均模型 

一个阶为的向量滑动平均模型 （ VMA (<7) 模型）具有形式 

r t = + o -, — &\ a t 1 — • • • — _ 9 或 r t = 0 it + Q ( B ) at , (8.23) 

其中是&维向氮 &, M k x k 矩阵， &( B ) = I - &,B - &,, B q 是向后推 

移算子 B 的 MA 矩阵多 项式. 类似于一元的情形.假定的协方差矩阵5：存在， 
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则 VMA ⑷ 过程是弱平稳的.将 (8.23) 式取期望，得到 m = E ( r t ) = B n . 这样，对 
VMA 模型而言，常数向量 0。 是 rv 的均值向最. 


880 885 80() 



指数 

图 8*6 利用为 IBM 股栗和 3&P500 指数的月对数收益率（以百分比形式给山）所拟合的 
VAR(l) 模型进行预测的预测图，扦本的时间区间从 1926 年 1 月到 1999 年 12 月 




图 8~7 为 IBM 股票和 S & P 500 指数的月对数收益率（以百分比形式给出）所拟合的 
VAR ( l ) 模型的正交新息的脉冲响应函数图，样本的时间区间从 1926 年 1 月 
到 1999 年 12 月 
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令子，= r , - 0 ,,为均值修正的 VAR ⑷过程.那么利用 (8.23) 式以及沁是 
序列不相关的専实，我们有： 

(1) Cov(r t ,a t ) = S; 

(2) r 0 = E + 0, 

(3) 若 i > «?，则 = 0; 

(4) 若 1 彡 f < y ，则 ri=Z 其中 ® 0 = -/• 

J==^ 

因为对于 / > 9, 有 q = 0, 所以 VMA ⑷过程 n 的交叉相关矩阵 (CCM) 满足 


Pl = 0, I > q. (8.24) 

因此，类似于一元情形，可以利用样本 CCM 来识别一个 VMA 过程的阶. 

为了更好地理解 VMA 过程，让我们考虑二元 MA (1) 模型. 


r t = 9 0 a t - ©a ( _i = // 十 a t - @a t _i, (8.25) 


这里为了简便，消除了 ©! 的下标.这个模型可以清楚地写为 


ru 



十 

Ql< 


'Bn 

㊀ 12 


ai ， 卜 1 

^ rat 


".3 


^2t 


,^21 

022 


a 2,e-i 


(8.26) 


它说明当前的收益率 r t 仅仅依赖于当前的和过去的扰动. 因此， 这个模型是一个 
有限记忆模型. 

考虑 (8.26) 式中〜所满足的方程，参数 e 12 表示 a !,*.! 存在时,对 a 2 ^ x 
的线性依赖.如果 On = 0,则 r u 并不依赖于的延迟值，因此也不依赖于 r 2 , 
的延迟值.类似地，如果 0 21 = 0,那么 r 2 i 并不依赖于 r it 的过去值 .© 的非对角 
元素反映了分 M 序列之间的动态依赖性.对这个简单的 VMA ( l ) 模型，我们可以将 
nt 与之间的关系分类如下. 

(1) 如果 e 12 = e 21 =0,则它们是分离的序列. 

(2) 如果 fha = 0 ,但021 / 0 ,则从 r lt 到、有一个申向动态关系.如果 
G 21 = () T 但0 12 ^0,则相反的争向动态关系成立. 

(3) 如果012 / 0,且 0 21 笋0,则 r lt 弓 r* 2t 之间有一个反馈关系. 

最后， r , t 之间的同步关系与之间的同步关系是一样的.前面的分类可以推 
广到 VMA ( g ) 模型. 

估计 


与 VAR 模型不同， VMA 模型的估计更加复杂.具体可参见 Hillmcr 和 Tiao 
( l 9 7 fl ) 与 Liitkepolil (1991) 及其参考文献.对似然近似法，有两种方法可以利用. 
第一种方法是条件似然方法，它假定对于 f < ()，有叫= 0. 第二种方法是精确似然 
方法，它将/ < 0时的叫看作模型的一个附加参数.为了获得估计问题的一些洞 
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察，我们考虑 (8.25) 式中的 VMA ( l ) 模型.假定数据为 { r t | t = 1，" . ， r }， 且是 
多元正态的.对一个 VMA ( l ) 模型，这个数据依赖于 a(J . 

条件 MT.R 

条件似然方法假定 U 0 = 0. 在这个假定下,将模型改写为 a t = 

我们可以递推地计算叫，有 

di = ri 0 ()， ci2 = r2 — 0(j — ® 1 ai，* • • • 

因此，数据的似然函数变为 

r 1 r I 

/(r 1? …， t t \ G q , ©l,S) = I] ( ^ 7 ~ 2|S|i/2 exp , 

t >— "I 

并据此得到参数估计. 

精确 MLE 

对精确似然方法， a u 是一个未知向量.为了计算似然函数，必须根据数据进行 
估计，为了简便，令6 n 为均值修正序列.利用与 （8.25) 式，我们有 

+ 0 a t _ i . (8.27) 

通过重复迭代， a (, 与所有的~都相关，因为 

aj =fj -f © a 0 , 

n 2 = f 2 -f = f 2 -f Brj -|- W 2 «o, (8.28) 


clt = i'T' 4 - Qf'T—i + • • • + O r 1 + 0^ao* 

这样如果给定 © 和知，则 a( , 是数据的线性函数.这个结果使得我们可以利用数 
据与％ 以及0的初始值来估计 an . 更具体地，给定 Go , e 与数据，我们可以定 
义： 

= f t 十 ©〜_!+•.. +© f — i = 1,2,.-- , T . 

则 (8.28) 式可以改写为 

r I = —© a t ) 十 a 】 ， 

= -© J a 0 4 - a2 , 

= —© r ao + ar . 


这是多元线性回归的形式，参数向量为 a 0 , 尽管 at 的自协差矩阵 E 可能 小是一个 
对角阵.如果 X ：的初始值也可以得到，则可以用5：的平方根矩阵 S - l/2 左乘上面 
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系统中的每个方稈.结果&的系统真的是一个多元线性冋归，且可以利用 OLS 方 
法來得到 a 。 的一个估计，表示为知. 

利用估计 do , 可以递推地计算扰动 a t , 因为 

ai = rj — 0 0 + a2 = T2 — 00 + ©c ^， . • •. 

该递推是从，…， rr ) 到（％，〜，•.. , a r ) 的线性变换.我们可以从中得到％ 
和数据的联合分布.另外，我们也可以从沁卞 = (),•..， r } 的联合分布中通过求 
的积分来推出数据的精确似然函数.可以利用如此求得的似然函数来得到精确的 
ML 估计.具体细节参见 Hillnier 和 Tiao (1979). 

总之，精确似然方法的操作 如下： 给定0 0 , © 与 S 的初始佔计，利用 （ 8.28) 式 
导出的 估计. 利用 （ 8.27) 式，这个佔计又反过来可以用来递推地计算 a , 且初始 
值为 ai = r t - l - « a 0 , 然后利用结果中的 { a t \ J = l 估计数据的精确似然函数，以便 
更新 0(,,© 和5：的估计.重复整个过程直至估计收敛.估计精确似然函数的这个 
迭代方法对一般的 VMA ( g ) 模型也是适用的. 

由前面的讨论知，精确似然方法比条件似然方法要求更多精深的计算.但是它 
也提供了更精确的参数估计，尤其是当0的某些特征值的模接近于1时 . Hillmer 
和 Tiao (1979) 给出了 VMA 模型的条件似然估计与精确似然估计之间的一些比较. 
在多元时间序列分析中.如果怀疑数据可能过度差分，则精确最大似然方法变得尤 
其重要.过度差分可能在很多情况下发生，例如，协整系统中单个分量的差分（参见 
后面对协整的讨论). 

总之.建立一个 VMA 模型需要三个步骤： （ a ) 利用样本交叉相关矩阵识别阶 
n (因为，对 VMA ( g ) 模型，当/ > 9 时 ， A = 0); ( b ) 利用条件似然方法或精确似然 
方法来估计指定的模型（当样本量不太大时.更喜欢用精确方 法)； （ c ) 应该检验所 
拟合模型的充分性（例如对残差序列利用 Q k (m) 统计量).最后，可以利用与一元 
MA 模型同样的程序得到 VMA 模型的预测. 

例 8 . 5 再次考虑由 TBM 股票和 S & P 500指数的月对数收益率（以百分比表示） 
所构成的二元序列，时间区间从年 i 月到 iyyy 年12月.因为显著的交叉相 
关主要在延迟 I 和延迟 3 处发生，所以我们对数据采用了 ['述 VMA (3) 模型： 

r t = f ) 0 + n t — Rtfit i - & a a t -3 (8.29) 

表心 《 给出了这个模型的估计 结果. 这个简化模型残差的 Q k (m) 统计置值为 Q 2 (4) = 
17.25, Q 2 (8) = 39.30. 与自由度为12和28的 X 2 分布比较，这些估计量的 p 值分 
别是 0.140 4和 0.076 2. 因此，该模型在5%的显著水平下是充分的. 

由表8-6,我们作出以下观测. 

(1) 对这个特例，条件似然估计与精确似然估计的差别很小.这并不奇怪，因为 
样本量并不小，而且更重要的是数据的动态结构很弱. 
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表 8-6 对 IBM 股票和 S & P 500 指数的月对数收益率拟合向量滑动平均模型 （8.27) 时 

的估计结果(时间 K 间是从1926年1月到1999年12月） 


参数 

»0 



T ： 

( a ) 整个模甩，用 

1条件似然方法 

估计 

1.24 

- U . U 13 

-0.121 

-0.038 

0.108 

44.48 

23.52 

0.54 

0.020 

-0.101 

0.014 

OJOfi 

23 52 

31 20 

标准差 

0.24 

0.043 

0.051 

0.044 

0.052 



0.18 

0.036 

0.043 

0.03() 

0.043 



( b ) 锒个模型 ， Hi 

1梢确似然//法 

估计 

1.24 

-0013 

-0 121 

-0.038 

0.108 

44.48 

23.52 

0.54 

0.020 

-0.10 

0.013 

0.105 

23.52 

31.20 

标准差 

0.24 

0.043 

0.051 

0.044 

0.052 



0 18 

0.036 

0.043 

0.036 

0,043 




( c ) 简化的模型，用精确似然方法 


估计 

1.24 

0.000 

-0.126 

0.000 

0.082 

44.54 

23.51 

U .54 

U.UUU 

- U . U 84 

0.000 

0.114 

23.51 

31.21 

标准茇 

0.23 


0.040 


0.040 




0.18 


0.033 

— 

0.033 




(2) VMA (3) 模型对序列提供了与例 8.4 的 VAR (3) 模型同样的动态关系. IBM 
股票的月收益率依赖 S & P 500 指数过去的收益率.相反地，市场收益率并不依赖 
于 IBM 股票的过去收益率.换句话说，数据的动态结构是由市场收益率而并不是 
IBM 收益率驱动的，然而.两个收益率序列间的同步相关性仍很强. 


8.4 向量 ARMA 模型 


—元 ARMA 模型也可以推广到处理向量时间序列的情形.所得的模型称为 
VARMA 模型.然而.这种推广会遇到一些在 VMA 和 VAR 模型时不会出现的新 
问题.其中一个问题 是识别 问题.与一元 ARMA 模型不同， VARMA 模型并不是唯 
—定 义的. 例如， VMA ( l ) 模型 


与 VAR ( l ) 模型 


ru 


^it 


’ 0 

2 ' 



• r 2t 


^2t 


0 

0 




ru 


0 

一 2 




an 

• 〒 2t 


0 

0 




0>2t 


是相同的.这两个模型的等价性可以通过检查它们的分量模型很容易地看出.对 
VMA ( l ) 模型.我们有 


r\t = a u — 2a 2l i-i, r 2i — a 2t . 

对这个 VAR ( l ) 模型，方程为 






















8.4 向量 ARMA 模型 323 


r\t + 2r 2 ,(_i = ait, r2t = a2t- 

由所服从的模型，我们有 = a 2 . t _ 1 . 因此 r lt 所服从的模型是相同的.这 
种类型的识别问题并没有坏处，因为在实际应用中，两个模型都可以使用. 

另一种类型的识别问题比较麻烦.考虑 VARMA (1,1) 模型 


ru 


' 0.8 

-2 ’ 


ri T t-i 


(lit 


• -n.5 

n " 



m r 2 t 


0 

0 


厂 2 ，金 一 1 


n 2t 


0 

0 


a 2 f t-l 


与 VAHMA(1,1) 模型 


ru 


' 0.8 

一 2 + 7 ； 


i 


flu 


• -0.5 r;" 


a l,t — 1 

T2t 


• 0 

U) 




a 2t 


0 LJ 




这两个模型对任何非零的 u ； 和7/是相同的.在这个特例中，等价性之所以成立是 
因为在两个模型中都有 r 2e = a 2< . 在第二个模型中，参数 a ; 和 ry 对系统的 AR 部 
分和 MA 部分的影响互相抵消了.这一个识别问题是严重的，因为，如果没有恰当 
的限制，数据的向量 ARMA (1,1) 模型的似然函数并不是唯一定义的，从而导致了 
类似于回归分析中的精确多重共线性的问题.即使没有一个分量是白噪声序列，这 
种类型的识别问题也会发生. 

这两个例子引出了推广到 VARMA 模型时涉及的新问题.这样，对一个给定的 
数据集合建立 VARMA 模型要求汴意一匙问题.许多时间序列的文献，已经提出 
T 用结构指定 (structural specification ) 方法来克服这种识别问题.可参见 Tiao 和 
Tsay (1989). Tsay (1991) 及其参考 文献. 我们这里并不讨论结构指定的细节，因为 
在大多数金融应用中， VAR 和 VMA 模型就足够了.当使用 VARMA 模型时，只关 
心低阶的模型（如 VARMA (1，1) 或 VARMA (2,1) 模型)，尤其是当涉及到的时间序 
列是非季节性模型时. 

VARMA (/ m /) 模型可以写成 

^(B)r, =<A 0 4- 0(B)a<, 

其屮伞 (0) = -伞 p 妒和 0(5) = I - S X B - & q Bq 是两个 kxk 

矩阵多项式.我们假定这两个矩阵多项式没有左公共因子，否则模型可以简化. r< 
弱平稳的充要条件与具有矩阵多项式中 (0) 的 VAR(p) 模型是相同的.对 r > 0,系 
数矩阵中,，和0,，的第 （ i ， j ) 个元素度量的分别是 n , 对，和 a it/ _ v 的线性依 
赖.如果对所有的 AR 和 MA 系数矩阵，都有第 （ i ， j ) 个元素为0,则~并不依赖 
于 r Jt 的延迟值.然而，在 VARMA 模型中反过来并不 成立. 换句话说，即使以并 
不依赖 F 的任何延迟值， AR 和 MA 矩阵的第 ( i , j ) 个位置也可以存在非0系 
数. 

为了说明上述问题，考虑下面的二元模型 
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ru 


• B n (/?) 

012(/?)' 


ait 

.^l(B) 

伞 22 (5) 




. e,AB) 

S 72 (B) 




这里从 到仏 存在攀向动态关系的充要条件是 

中 22( 沒 )©12( 召 ) 一中 12( 月 )㊀ 22(B) = 0, 

但是 

^ U (S)0 21 (B)- ^ 2l (B)B n (B)r/.0. (8.30) 

这些条件可以如下得到，令 

n(B) = 陣 )| = <l>u(/?)^ aa (/?)- *ia(H)^2i(H) 

为 AR 矩阵多项式的行列式，将模型左乘 f ，可以将这个二 

^ u ( B ) 

元模型改写为 


^(5) 


ru 

Tit 


<{>22(0)011 ( D ) —中 12(5)021( 忍)巾 22( 打 )㊀ 12( B ) — *12(石) ㊀ 22(召) 
中 11( 丑 )021(5) 一 ^2 l ( B )© U ( B ) ^ u ( S )©22( B ) - ^2 l ( B ) e 12 ( B ) 



«2 f 


考虑 nn 的方程. (8.30) 式的第一个条件表示 nt 并不依赖于 a 2t 或 r 2 t 的任何过 
去值.对 r 2t 的方程， (8.30) 式的第二个条件隐含了 r* 2t 确实依赖于 《 lt 的某些过去 
值.根据 (8.30) 式， 012( B ) = ^ 12 ( B ) =0是从 r u 到〜存在单向关系的充分但不 
必要条件. 

VARMA 模银的估计可以通过条件最大似然或精确最大似然方法来实现.对 
拟合模型的残差序列， Q k ( m ) 估计量仍然适用，但是它的渐近 x 2 分布的自由度为 
k 2 m - g , 其中是 MA 和 AR 系数矩阵中待估参数的个数. 

例 8.6 为了说明 VARMA 的建模，我们考虑美国的两个月利率序列.第一个序列 
是期限为1年的国库券 利率； 第二个序列是期限为3年的国库券利率.数据宋自丁- 
圣 ■ 路易斯联邦储备银行，样本区间是从1953年4月至2001年1月，共574个观 
测值.为了确保美国利率为正，我们分析对数序列.图&8表明了两个对数利率序 
列的时问图.实线表示1年期利率.这两个序列在样本期间内的运动非常接近. 

M ( i ) 统计量和 AIC 准 则刘数 据指定了一个 VAR (4) 模型.然而，我们采用了 
—个 VARMA (2,1) 模型，因为这两个模型提供了类似的拟合.表 8-7 给出了由精确 
似然方法得到的 VARMA (2,1) 模型的参数估计.我们去掉了不显著的参数并且重 
新估计了简化的模型.所拟合模型的残差序列具有轻微的序列相关且在延迟7和 
延迟11处有交叉相关性.阌给出了残差图，从图中可见存在一些异常数据点. 
模型可以进一步改善.但是它看上去已经很好地刻画了数据的动态结构. 
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图从1953年4月到2001年1月美国月利率对数的时间图.实线为1年期的国库券的 
月利率的对数，虚线则对应3年期 


表8~7基于精确似然方法对美国的两个月利率序列拟合 VARMA (2,1) 模型时的参数估计 


Parameter 

中 1 一 

中2 

少0 

© 1 一 

Ex 

10 3 

Estimate 

1.82 

-0.97 

0.09 

-0.84 

0.98 

0.028 j 

0.025 

0.90 

-1.66 

-0.47 

3.58 

2.50 

2.50 

2.19 

Standard error 

0.03 

0.08 

0.01 

0.03 

0.08 

0.014 

0.011 

0 03 

0.10 

0.04 






(a) 1 年期利串的残差 




图 8* ( J 例 8.6 中美国的两个月利率对数的残差图.所拟合 模型为 VARMA(2,1) 揆型 


最后的 VARMA (2, 1) 模型表明数据具有一些有趣的特征.第一，利率序列是 
高度同步相关的.同步相关系数为2.5/>/3.58 x 2.19 = 0.893. 第二，从3年期利率 
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到1年期利率存在单向线性关系，因为所有 AR 和 MA 矩阵的第 (2,1) 个元素都 
为 （). 佴某歧第 (1,2) 个元素不是 （1. 事实卜.，表8_7中的模型 说明： 


❻= 0.025 -f 0.99r；{ it _i + a；» 4 - 0.47a ； j,<_i ， 
f"it =0.028 4 - 1.82ri , 卜 1 — 0.84rj ( f _2 — O.OTro^—i -t- 0.98r3 t t_2 
+an — O.OOai^-i + 1.66a3,t_i, 


其中 rit 为 i 年期利宇的对数序列，为相应的扰动序列.因此 . 3年期利宇并不 
依赖于1年期利率的过去值，但是1年期利率依赖于3年期利率的过去值. 第三, 
这两个利率序列看上去似乎是单位根非平稳的，利用向后推移算子认模型可以近 
似改写为 


(1 - B ) r M = 0.03 + (1 + 0.47 B ) a 3t , 


(1 - B)(l- O.S2B)ru = 0.03 - 0.975(1- 3)r M 十 （1 - 0.9Z?)a ]t + 1.66Sa 3t . 

分量的边际模型 

给定 r , 的一个向量模型，隐含的组成部分~的一元模型就是边际模型 (mar¬ 
ginal models). 对一个 A: 元 ARM A(p, q) 模型，边际模型是 ARMA[kp, (k - l)p + gj. 
这个结果可以通过两步得到.第一步， VMA(q) 的边际模型是一元 MA(q). 假定 r, 
是一个 VMA(q) 过程.因为 r , 的交叉相关矩阵在延迟 q 步截尾（即对 l>q 、有 
p , = 0)，的 ACF 在超出延迟 g 后是 0. 因此 . r it 是一个 MA 过程，并且它的一 

元模型具有形式~ + f 这里{6„}是不相关的随机变量序列，均 

j'=i 

值为 0, 方差为 <rf b . 参数和是 r t 的 VMA 模型参数的函数. 

第二步要得到的结果是对角化 VARMA ( p , q ) 模型的 AR 矩阵多项式.为了更 
好地说明，考虑二元 AR (1) 模型 


'1- 中 11(0) 

一少 12( 丑） 


T\t 


(lit 

—<1>2|(5) 

1 一中22(乃) 


Tit 




左乘多项式 


中 22 ⑻ 
^>21(0) 


4> l 2 ( J 5) 

l -^ u ( J 5) 


，得到 


|(1 — 中 hJ 3)(1 — 中22万）一中 12 中 22万~1 


rit 


1 —中 22( 只) 




r 2 t 


^ 2i ( rt ) 



«2< 


前面方程的左边表明的一元 AR 多项式是2阶的，而方程的右面具有 VMA ( l ) 
的形式.利用第一步中 VMA 模型的结果,我们证明了〜的一元模型是 ARMA (2,1) 
的.这个方法很容易推广到 fc 元 VAR ( l ) 模型，其边际模型为 ARMA ( Ar ， fc - 1). 更 
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—般地，对一 个&元 VAR ( p ) 模型，其边际模哦为 ARMA ( A ： p , ( A - - l ) p ]. VARMA 模 
型的结果可直接从 VMA ^ VAH 模型的结果中得到. 

阶 [ fcp , ( Ar - l ^ + r /] 是边际模型的最大阶（即上界 ). 〜的真实边际阶可能会更 
低. 


8.5 单位根非平稳性与协整 


当对儿个单位根非平稳时间序列联合建模时，可能遇到协整的情况.考虑二元 
ARMA (1,1) 模型 


工 It 


0.5 

-1.0 




au 


0.2 

-0.4 . 



^2t 


-0.25 

0.5 




^2t 


-U.l 

0.2 




(8.31) 


其中扰动 a , 的协方差矩阵 S 是正定的.这并不是一个弱平稳模型.因为 AR 系数 
矩阵的两个特征值分别为0和1.图 8-10 给出了 S = J 时的200个模拟数据点的 
时 间图； 而图给出了两个分量❿的样本自相关系数.很容易看出，这两个序 
列具有高度自相关而且表现出单位根非平稳的特征 . a :, 的两个边际模型的确是单 
位根非平稳的.将模型改写为 


1 - ().55 

B 




1 - 0.2B 

DAB 


ait 
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1 - O.hB 
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图 8 - 10 当扰动的协方差矩阵为单位阵时， ( 8 - 31 ) 式所定义模型的模拟序列的时间图 
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图 8-11 当扰动的协方差矩阵为单位阵时， (8.29) 式所定义模型的两个模拟分量序列的样本自 

相关函数图.观测值为2()(】个 


将上述方程乘以 


1 - 0.5 J 5 -B 
-0.25 J 3 1 - 0.5 B 


，得到 


' 1 -B 
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Xlt 


'1 - OJB - 0 . 6 B ' 


d\t 
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X 2 t 


-0.155 1 - 0 . 7 B 


<^ 2 t 


因此，模型的每个分 fi ^都是单位根非平稳的，且服从一个 ARIMA (0,1,1) 模型. 
然而，我们可以考虑如下一个线性变换.定义 


yu 


'1.0 

-2.(】 

V 2 t 
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变换序列的 VARMA 模型可以得到 


^it 

^2 t 
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三 LOrf . 


Lxt = L^xt-i + Lai — L0at_i 

— L L/Xt i -|- Lett — L&L LfO，i - 1 
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这样 . A 的模型为 


yu 


1.0 o ' 




bit 


0.4 0 



_ V 2 t 


0 0 


-取 t —1 


f ^2 t 


0 0 




(8.32) 












8.5 单位根非平稳性与协整 329 


由此模型看出： （ a ) /川与 ㈣ 是分离序列，其同步相关系数等子扰动 fc u 与& 2 ，.之 
间的同步相关系数： （ b ) y lt 服从一个一元 ARIMA (0,1,1) 模型; （ c ) y 2t 是一个白哚 
声序列 （即？ - 心). 特别地. (8.32) 式的模型表明系统中只有一个单位根.因此 

与2:2，的申1位根是由 2/ it 的单位根引入的.在相关文献中，称 Wit 为 Xif 与 
的共同趋势. 

• ru 与 *1^ 都是单位根非平稳的但在向量序列中只存在一个单位根，这种现象 
在计量经济和时间序列文献中称为协整 （ co ~ Lnt . egraUcm ). 另一个定义协整的方 A 则 
着眼于单位根非平稳序列的线性 变换. 在对模型 （8.31) 进行模拟的例子中，变换表 
明线性组合伽= 0.5 x lt + x 2 , 没有单位根.因此，称 X ! ，与; r 2< 是协整的，如果⑷ 
它们两个都不是单位根平 稳的； （ b ) 它们的一个线性组合是单位根平稳的. 

一股而言，对一个元单位根非平稳时间序列，如果系统中的单位根个数小于 
k ， 则协整 存在. 令/ I 表示 A " 元序列中单位根的个数.如果 0 < h < k ， 则存 
在 协整. 而且，为协整因子的数目 • 换言之，协整因子的个数为具有单位根 
平稳性的不同线性组合的个数，这种线性组合称为协整向量.对前面模拟的例子. 
<V2 , = (0.5,1)^, 因而（0.5, 1)' 是系统的一个协整向量.更多关于协整和协整检验的 
讨论，可参见 Box 和 Tiao (1977), Engle 和 Granger (1987), Stock 和 Watson (1988) 
以及 Johansen (1988). 我们将在 8.6 节讨论协整 VAH 模型. 

协整的概念很有趣.并且在文献中已经引起了人们的大量关注.然而，实际应 
用中对协整的检验有些 困难. 困难的主要原因是协整检验忽视了分量序列的尺度效 
应.感兴趣的读者可以参考 Cochrane (1988); Tian. Tsay 和 Wang (1993). 这些文 
献中有进一步的讨论. 

尽管我对协整检验的实际价值感到怀疑，然而办整的思想与金融研究是高度相 
关的.例如.考虑 Finnish Nokia 公司的 股票. 它在 Helsinki 股市上的价格必领与 
纽约证券交易所中它的美国信托收据 (American Depositary Receipts ) 的价格联动， 
否则对投资者而言就#在套利机会.如果股价有单位根，则两个价格序列一定是协 
整的. 实际中.在调整交易成本和汇率风险之后.就存在这样的协整.稍后在 8.7 节 
中我们将讨论此问题. 

误 差-修 正形式 

因为在协整系统中.单位根非平稳分量的个数多于单位根的个数.所以对于单 
个分量差分所得到的平稳性结果是差分过度的.过度差分导致了 MA 矩阵多项式 
中的单位根问题.这反过来可能在参数估计中会遇到困难.如果 MA 矩阵多项式包 
含申-位根，则称向量时间序列是不可逆的. 

Engle 和 Granger (1987) 讨论了一个协整系统的误差修正 表示. 它克服了不可 
逆的 VARMA 模型估计中的困难.考虑 （8.31) 式的协整系统.令 又 
是差分后的序列.将代入方程的两边.我们得到对△: c , 的一个模型， 
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这是一个平稳模型因为与 [0.5,1.0] = y 2t 都是单位根平稳的.因为上述 

方程的右端用到了 所以 MA 矩阵多项式同未差分前一样，从而模型不会遇 
到不 " J " 逆 M 题.此公式称为的误差修正模型 （ error — correction model ). 它可 
以扩展到一般的协整 VARMA 模型.对一个具有 m 个协整因子 （m <幻的协整 
VARMA ( p , 9 ) 模型.其误差修正表示为 

p — I q 

Ax t = a / 3 ' xt-i + ^ Ax ( -i + a ( - Y " & ja t ~ j , (8.33) 

i=l j=l 

这里 《 和 0 都是 A : x m 满秩矩阵 . AR 系数矩阵*：是原始系数矩阵伞」的函数, 
具体地，我们有 

P 

中 ：= - ^2 *•» i = I ,--- , p - 1, 
i = j+l 

a/3 ; = 十中 p-i 十 • •. + 4>i — J = — 少 （ 1), (8.34) 

该结果是令 AR 矩阵多项式的系数矩阵相等得到的.时间序列是单位根平稳 
的，并且/3的行向量为的协整向量 

在误差修正表示 (8.33) 中出现平稳序列是很自然的，可以将它认为是 
过度差分系统中的一个“弥补”项.平稳性的证明 如下： 单位根时间序 
列理论证明了单位根非平稳序列与平稳序列之间的样本相关系数在样本量趋于无 
穷时收敛到 0. 参见 Tsay 和 Tiao (1990) 及其参考文献.在个误差修正表示中， 
^-1 是单位根非平稳的.但是是平稳的.囚此，将 △而与 有意义地联系 
起来的唯一方式是通过平稳序列 (3' xt.L 

注释： 我们对协整的讨论假定所有的单位根重数为 1. 但是这个概念可以扩 
展为单位根为多重的 情形. 如果协整因子的个数 m 给定，则 (8.33) 式的误差修正 
模型仍然可以通过似然方法来估计.下一节我们将讨论协整 VAR 模型的简单例子. 
最后.有许多方式可以用来构造误差修正 表示. 事实上.在 （8.33) 式中，只要对 AR 
系數矩阵 f 进行某些修正.则对任何的 t ; 满足1 < 彡 p , 都可以用 a ( 3 ' x t ^ v . □ 

8.6 协整 VAR 模型 

为了个更好地理解协整，我们集中讨论 VAR 模型，这主要是因为它们很容易估 
计.考虑可能带有趋势项的 A ： 元 VAR ( p ) 时间序列 a : t: 
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a;, = /x, 4 伞 iA-i + ... + ^pXt-p + Oi. (8.35) 

其中新息叫为高斯的，并且 =Mo + /^i ^ 这里和 A 都是维常数向量.记 
中 ( B ) = 1- -…如果 | 中 (/ i)| 的所有根都在单位 [Ml 外.则 x , 是单位 

根平稳的.在相关文献中，称一个单位根平稳过程为 7(0) 过程.即该过程是不可加 
的.若 | 中 (1)| = 0, 则称 a 为单位根非平稳的.为简单起见，我们假定^至多是一 
阶可加过程，即/⑴过程.这意味着，如果 A 不是单位根平稳的，则 （1 - B ) x lt m 
单位根平稳的. 

VAR(p ) 过程: r t 的误差修 TF . 模型 ( ECM) 具有如下 形式： 

-f nx,_i + + .. • + %_ 1 Aa: t _p +1 + a <， (8.36) 

其中 f 由 (8.34) 式定义，且 II = = -中 (1). 我们称 (8.36) 式的 nx ( _x 为误 

差修正项，该项在协整研究中起着非常重要的作用.注意到屯可以由 ECM 表示 
通过下式恢复 出来： 

=/ + n + ^;, 

中1 =中：—中二1， i = 2，...，p 

其中为零矩阵 基于〜 至多是/( I )过程的假定.有 (8.36) 式的是/(0) 
过程. 

如果而 包含单位根，则 |^(i)| = 0,从而 n =中 (1) 是奇 异的. 所以在考虑 
(8.36) 式的 ECM 时.有下面三种情况. 

(1) Rauk(n) = 0,这意味着 n = 0 且不是协整的. (8.36) 式的 ECM 退化 
为 

4» ； Aa ； e_i + ••• + +a«, 

因此服从带确定性趋 势仏的 VAR(p - 1) 模型. 

(2) Rank(n) = k . 这意味着|4>(1)| ^ 0,从而叫不包含单位根，即^是 1(0) 
过程.此时 ECM 模型是无效的，直接研究&即可. 

(3) 0< IUuk(n) = m < k . 在这种情形下，可以将 n 写为 n = a 改， 其中《 
和 /3都是 A： x m 矩阵且 Rank(o：) = Rauk(/3) ^ m. (8.36) 式的 ECM 变为 

n = «/3’， (8.37) 

这意味着是协整的，有 m 个线性独立的协整向量 u;, = /3'act, 有 A _m 个单位 
根.这些单位根给出了 a: t 的 fc_m 个公共随机趋势. 

如果心 是协整的并且 Rani(n) = m, 则得到这 k - m 个公共趋势的一个简单 
办法是先计算 a 的正交补矩阵《丄，即 a± mkx ( k - rn ) 矩阵并且满足« = 0. 
这里的0是々 x (A： - m) 阶零 矩阵； 然后令 y, = a', a:,. 实际上，在 ECM 两端左乘 






并利用 n = « 〆 ，所得到的方程不再含有 误差修 正项.因此 a ： - w 维向量仏 
应该有 - m 个单位根.为进一步说明，考虑 8.5.1 节的二元例子.对于该特殊情 
形 ， a = (—1， — 0. 5 /，<»丄=(1， —2)'. 因此 y , = (1， —2) x ( = x\t — 2 x 2 t f 这正是 (8.32) 
式的单位根非平稳序列 i / u . 

注意到 (8.37) 式的因子分解是不唯一的，因为对于任何 m x m 阶 m 交矩阵 
满足 nn , = /,我们有 

aft ' = = ct »/3'., 

其中和 f 的秩都是 m . 若要唯一确定《和/?，则需要额外的限制条件.通常 
要求 /3' = [ J m .焫] ，其中 J m * m xm 单位阵 . &是 （A - m ) xm 矩阵.实际中，这 
可能要求将; c t 的分量进行重排，使得前 m 个分量都有单位根.为了使 a; t = (3， x t 
是单位根 T •稳的，《和0的分量必须满足其他的限制.例如.考虑有一个协整向量 
的二元 VAR ( l ) 模型.这里 ， fr = 2, m = 1, ECM 是 

Ax t = + 

«2 

在上式中左边同乘以才，利用 U； t _i = (3 f X t ^ t , 并且将移到方程的右边，我们 
可以得到 

w t = P’Pt + (1 + Q：i + ct 2 / 3 i ) wt-i -f b ty 

其中 = (3' a ,. 这意味着 w 是平稳 AR (1) 过稈.闵此， r >, 和汍 必须满足平稳性 

限制 1 1 + Q ；1 + I < 1 • 

前面的讨论表明，在 (8.36) 式的 ECM 中_ n 的秩是协整向量的个数.因此要检 
验协整，只需要检查 II 的秩. 这正是 Johanscn (1988. 1995) 和 Reinsel 和 Alm (1092) 
所采用的方法. 

8.6.1 确定性函数的具体化 

类似丁•一元的情形，协整检验的极限分布依赖于确定性函数本小节将讨 
论文献中已有的叫的具体指定 问题. 为了理解下面的一些陈述，记住对于 
协整序列; c t 的共同随机趋势给出了一种表示. 

(1) !h = 0：此时^的所有分量序列都是不带漂移项的 f ( l ) 过程，平稳序列 

ai t = 的均值为 0. 

(2) tx t ~ tx Q - aco , 其中 co 是 m 维非零常数向量. ECM 变为 

— +Cq) + + •.. + + a/, 


因此 A 的所有分量序列都是不带漂移项的/( I )过程，但是叫有非零均值- C| , 
这是限制为常数的情形. 
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(3) li t =叫/ (). 这时， A 的所有分景序列都是带漂移项从，的/( I )过程且 
UH 有非零均值. 

(4) n , = M 0 + « C !<, 其中 Cl 是非零向最. ECM 变为 

△»t = Mo + oi^xt-i + Cit) ^\Ax t -i + ••• + +o,. 

(8.38) 

囚此心的所有分量序列都是带漂移项的 /(i) 过程且⑻有与 C| / 相联系的线 
性时间趋势.这是带限制性趋势的情形. 

(5) / x t = M „ + 其中仏是非零的.这里常数和趋势都是没有限制的 . &的 
分 M 都是带二次时间趋势的/( I )过程，叫具有线性趋势. 

显然.最后一种情形在实证工作中不是很常见.对于经济序列而言第一种情况也不 
常见，但是可以代表某些资产的对数价格序列.第三种情况在给资产价格建模时也 
很有用. 

8.6.2 最大似 然估计 

本小节将简要列出协整 VAR .( p ) 模型的最大似然估计方法.假设数据为 { x t \t = 
I ,-**, T }. 小失一般性，记 ⑷ M ‘其中 d , = [ M ] ; ， 这可以理解为〜依赖于前 
一小节的具体指定.对于给定 II 的秩 m ， ECM 模型变为 

△ a :, - fid, + 4 - I ••- | %_ 1 Aa; t _ p 十 ！ 十 a t , ( 8 . 39 ) 

其中/ = p + i ，...， r . 估计中关键的一步集中在与确定性项和平稳效应相联系的 
似然函数 L 这可以通过考虑下面的两个多元线性回归得到 

△it = 7od< + flxAxt-i + ... + +u t , (8.40) 


xt-i = Ifidt - t - S | Aa :,_, + ••• + S p _ iAa; < _ r+ i -f v t . (8.41) 

令 i 和 h 分别表示 (8.40) 式和 (8.41) 式的 残差. 定义下述样本协方差矩阵 

5 °° = T ^, 5 Z 5 01 = 7^ 51 

F *=p+i v f= P +i 1 p t= P +i 

接下来，计算 S U ) S ^ l S 0 i 关于的特征值和特征向量.这等价子求解下述特征 
值 问题： 

11 s iqSq ( 1 s ( ,i| = o. 

将特征值和对应的特征向量记为 ( A „ eO , 其中 A , > A 2 > - Afe . 这里特征向量已 
经标准化了，即 e ' S n e = I . 其中 e = [ ei ，...， efc j 是特征向量矩阵. 
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协整向量/3的未标准化的最大似然估计 ( MLE ) 是$ = [ ei ，… , e m ], 由此可以得到 
/3的满足识别性限制和标准化条件的 MLE . 将得到的估计记为艮，其中下标 c 表 
示满足一定限制.其他参数的 MLE 可以由下述多元线性回归 得到： 

九 • 

Axf = fidt + oc/3 c a ： f. 1 十 Axf_ 1 十 • • • + + ci/• 

基于 m 个协整向量的似然函数的最大值为 

^max^ a I ^00 1 JJ(1 - Ai). 

在检验 Rank ( n ) = m 的似然比检验中会用到该最大值.最后 a 和/3的正交补可 
以由下式 得到： 

&丄 = *^ao •S'll^w + li …1 e fc]i 3 丄 = s ll[6m + l ， … ， ejfc]. 

8.6.3 协整检验 

对于具体的确定性项我们来讨论检验 (8.36) 式中矩阵 n 的秩的最大似然 
检验■令 //( m ) 为零 假设: Rank ( n ) = m , 例如，在 刪下， Rank ( n ) = 0,从而 
n = o , 即没有协整.这些零假设具有如下关系 

W(0) C ... C H ( w ) C ... C H ( k ). 

为进行检验， (8.39) 式变为 

△a;i — 十 Ax<_i 十 •.. 十 Ax^_ p+ i + a<, 

其中 f = p + 1 ，...， r . 我们的目标是检验 n 的秩.从数学上来讲 . n 的秩是 n 的 
非零特征值的数目，从而如果能得到 n 的相合估计.则可以估计 n 的秩.基于前 
面的方程（该方程是多元线嗖回归的形式)，我们看到 n 是调 整本和 t (/ = 
i ，...， p - i ) 带来的效应后^ 1和的协方差矩阵.必要的调整可以由上一小 
节处理多元线性回归的技巧得到.事实上，调整后的和△而分别为匕和心,. 
于是进行协整检验的方程变为 

tit = + a t . 

在正态性假设下，可以用 h 和4的典型相关分析进行上式中 n 的秩的似然比 
检验.关于典型相关分析参见 Johnson 和 Wichern (1998). 因为已经调整了 d ,. 和 
,(7： = 1， •…， p ) 带来的效应，所以与典型相关分析相联系的是1和 X t _! 
偏典型相关分析.量 { A ,} 是叫和 h 的典型相关系数的平力. 

考虑假设 

H 0 : Rank ( II ) = m 对 H a : Rank ( ll ) > m . 
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Johanseu (1988) 提出下述似然比检验统计量来进行检验： 

k 

LK u { m ) = -(T - p ) ^2 ln(l — Ai ) (8.42) 

t = m-Kl 

若 Rank ( II ) = m . 则当 /: > m 时 \ 应该很小，因此 Lh \ r ( m ) 也应该很小.该检验 
称为迹协整 检验. 由于单位根的存在， LI < u ( m ) 的渐近分布不再是 x 2 分布.而是标 
准布朗运动的函数.因此 LK tr (, n ) 的临界值必须通过模拟得到. 

Johaiisen (1988) 还考虑了一列程序来确定协整向量的个数.特别地.考虑下述 
假设： 

Ho '■ RankiTl ) = m 对 H a : Rank ( n ) = m + 1. 

LK 检验统计量.也称为最大特征值统计量，为 

LA ’ max ( m ) = — {T — p ) ln(l — A m + i ). 

问样.统计量的临界值是非标准的，必须通过模拟来得到. 

8.6.4 协整 VAR 模型的预测 

所拟合的 ECM 模型可以用来进行预测.第 一 ，基于被估参数， ECM 方程 oj 以 
用来得到差分序列的预测.这样的预测可以反过来得到的预测. ECM 蚀 
测和传统的 VAR 预测的区别在 j •用 ECM 方法进行预测时加上了协整关系. 

8.6.5 例子 

为了进步说明 VAR 模型的协整分析，考虑两个美国短期周利率.序列分别为 
I 958 年 I 2 月 I 2 日到 2 00 4 年8月6日的3个月期和个月期的国库券利率.数 
据来自于二级市场，是从圣.路易斯联邦储备银行得到的.图 8-12 给出/利率序列 
的时间序 列图. 如所料想，这两个序列的运动非常靠近. 

我们的分析是在 S - Plus 中进行的，进行 VAR 分析时利用命令 VAR , 进行协整 
检验时利用命令 coint , 进行向量误差修正估计时利用命令 VECM . 分别用 tb 3 m 和 
tb 6 m 表示两个序列，并定义向量序列 x , = ( tb 3 m , tb 6 m ) / . 扩展的 Dickey - Fuller 单 
位根检验不能拒绝每个个体序列有单位根的假设.参见第2章.实 际上， 当给3个 
月期和 G 个月期的利率序列拟合 AR (3) 模型时,检验统计量分别为 -2.34 和 -2.33, 
V 值大约为 0-16. 这样.我们继续进行 VAR 建模. 

对于二元序列 or ,, BIC 准则选择了 VAR (3) 模型. 

> x = cbind ( tb 3 m f tb 6 m ) 

> y = data . frame ( x ) 

> ord • choice $ ar.order 
tl ] 3 
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㈨ 



( 1 ») 



年 

图 8-12 两个美国短期周利率的时间序列阁.样本的时间区间是从1958年12月12 R 到 

200.1 年8月6曰 .（ a ) 3个月期国库券利率： （ b ) 6个月期国库券利率.数据来自 
二级市场 


为了进行协整检验，我们选择常数限制的/ V 因为事先没有理由相信美国利率存在 
漂移. .lohanscu 的两个检验都证实了拟合 VAR (3) 模型时，这两个序列是有一个协 
整向量的协整序列. 

> cointst.rc=coint(x,trend- f rc # # lagc-2) % lags =P* 1 - 

> cointct.re 
Call ： 

coint《Y = x, lags = 2, trend = "re") 

Trend Specifications 

HI*(r) : Restricted constant 


Trace tests sign, at the 5% 
Trace tests sign. at the 1% 
Max Eig. tests sign, at the 
Max Eig. tests sign, at the 


丄 eve 丄 are flagged by # . 

level are flagged by 
5% level are flagged by # *•. 
1% level are flagged by # # . 


Tpst-.q for Cointegration Rank : 

Eigenvalue Trace Stat 
H(0)++** 0.0322 83.2712 

H(l) 0.0023 5.4936 


95% CV 99% CV 
19.96 24.60 

9.24 12.97 


Max Stat 95% CV 99% CV 
H(0)++** 77.7776 15.67 20.20 

H(l) 5.4936 9.24 12-97 


接下来.用 ECM 表示对该协整 VAR (3) 模型进行最大似然佔计.结采 如下: 






> vecm.fit=VECM(cointst.rc) 

> summary(vecm.fit) 

Call: 

VECM(test = cointst.rc) 


Comtegrat ing Vectors 


tb6m 
(std.err) 
(t.stat) 

Intercept* 
(std.err) 
(t•stat) 


coint. 1 
1.0000 

-1.0124 

0.0086 

-118.2799 

0.2254 

0.0545 

4.1382 


VECM Coefficients: 


coint. 1 
(std.erx) 

(t. star.) 

tb3m 

-0.0949 

0.0199 

•4.7590 

tb6m 

•0.0211 

0.0179 

-1.1775 

tb3m.lagl 
(std.err) 

0.0466 

0.0480 

-0.0419 

0.0432 

(t.stat) 

0.9696 

-0.9699 

tb6m.laql 
(std.err) 
(t.stat) 

0.2650 

0.0538 

4.9263 

0.3164 

0.0484 

6.5385 

tb3m.Iag2 
(std.err) 
(t.Stat) 

-0.2067 

0.0481 

-4.2984 

-0.0346 

0.0433 

-0.8005 

tb6m.Iag2 
(std.err) 
(t.stat) 

0.2547 

0.0543 

4.6936 

0,0994 

0.0488 

2.0356 


Regression Diaqnostics : 

th3m tb6m 
R-squared 0.1081 0.0913 
Adj. P-squared 0.1066 0.0898 
Resid. Scale 0.2009 0.1807 

> plot(vecm.fit) 

Make a plot selection (or 0 to exit) : 


1 : plot : All 
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2: plot : Response and Fitted Values 
3 : plot : Residuals 

13: plot : PACF of Squared Cointegrating Residuals 
Selection ： 

如所料想，输出结果表明平稳序列为叫 《 tb3m t - th6m tf 的均值大约为 
-0.225. 拟合的 ECM 模型为 

+ 0.23) + 


-0.21 0.25 A 

△ajf-2 + o.t, 

-0.03 0.10 

估计的的标准误差分別为 （).20 和 0.18. 可以通过不同的图来检查所拟合模型 
的允分性.为了进一步说明，图8~13给出了协整残差图.在图中有一些大的残差， 
这发生在1980年早期，利率很高并且波动剧烈. 

1,5 

1.0 

0.5 

0.U 


-0.5 

-I.U 

-1.5 


图 8-13 为美闽短期埤利率拟合的 ECM 的协整残差图.样本的时 faj 区间是从 
1958年12月12日到2004年8月6円 

最后.我们用拟合的 ECM 模型来产生和; E, 的向前1步预测和向前10 
步预测.预测原点是2004年8月6日.图 8-14 和图 8-15 分别给出了差分序列和 
原始序列的预测图.这两个阁中都包含一些观测数据点.阁中的虚线是置信水平为 
95%区间预测由于单位根非平稳性的存在，该区间很宽且没有实际意义. 

> vecm.fst=predictIvecm.fit, n.predict=10) 

> summary(vecm.fst) 




0.05 0.27 A 
-0.04 0.32 * ,_1 
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Predicted Values with Standard Errors : 


tb3m tb6m 


1- step-ahead -0.0378 -0.0642 

(std.err) 0.2009 0.1807 

2- step-ahead -0.0870 -0.0864 


(std.err) 0.3222 0.2927 


10-step-ahead -0.2276 -0.1314 
(otd.err) 0.8460 0.B157 

> plot(vecm.fst,xold=diff(x)•n.old=12) 


> vecm.fit.level=VBCM(cointst.rc,levels=T) 

> vecm.fet.level«predict(vccm.fit.level, n.predict=10) 

> summary(vecm.fst.level) 


Predicted Values with Standard Errors : 

tb3m tb6m 

1- step-ahead 1.4501 1.7057 

(std.err) 0.2009 0.1807 

2- step-ahead 1.4420 1.7017 

(std.err) 0.3222 0.2927 

• « • 

10-step-ahead 1.4722 1.7078 
(sf-d-err) 0.8460 0.8157 
> plot(vecm.fst.level, xold=x, n.old=50) 

2375 2380 2385 239 () 




指数 


图 8-14 利用为美国短期周利率拟合的 ECM 进行预测的预测图.预测是关于差分序列的. 
臣预测原点是2004年8月 G 口 
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2340 2350 2360 2370 2380 230H 




图8>15 利用为美国短期周利率拟合的 ECM 进行预测的预测图.预测是关于利率序列的. 
且预测原点是2004年8月 G 日 


8.7 门限协整与套利 

本廿主要讨论在指数交易中利用多元时间序列方法探测套利机会.同时，我们 
指出，与协整思想相结合，第4章中简单的一元非线性模型 oj 以自然地推广到多兀 
情形. 

我们的研究考虑 S & P 500 指数期货的价格与现金市场上以该指数为标的的股 
份价格之间的关系.令表示到期时间为/的指数期货在时刻 （ 的对数价格，且 
令&表示现金市场上的以指数为标的的股份在 < 时刻的对数价格.在金融文献中， 
实现成本模型 ( cost - of-carry model ) 的一个版本认为 

ft,i — = { r t ,i — qt . i)(l — t ) •¥ Zt , (8.43) 

这里/ V 是无风险利率 ， 是关于〖时刻现金价格的红利收益 ， （Z 0是期货合约 
的到期时间.具体可参见 Brenner 和 Kroner(1995), Dwyer, Locke 和 Yu (1996) 及 
其参考文献. 

模型 (8.43) 中的过程 z ( * 必须是单位根平稳的，否则就存在持续的套利机会. 
这里的套利交易包枯，当期货合约在到期日以前的对数价格偏离到大于随时间持有 
指数的成本时，同 N 购买（卖空）证券指数，并卖出（购买）指数期货.在4的弱平 
稳假定下，为了有利可图，岑的模一定超过一个由交易成本和其他的经济因索和风 
险因素决定的一个特定值. 
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通常认为 S & P 500 指数的 / u 与〜序列都包含一个单位根，但是 (8.43) 式表 
明它们在调整利率和红利收益的影响之后是协 整的. 调整后的协整向量为 （1, 一 1). 
协整序列是彳.因此，应该利用误差-修正形式束对收益率序列7>, = (△/£，△〜 〆 建 
模，这里 △/» =心 — / A . s , = - St _!, 并且为了记号的简便.我们将到期时 

间/从 A / t 的下标中去掉了. 

8.7.1 多元门限模型 

实际中，套利交易影响市场动态.从而.依赖于套利交易的存在与否 r , 的模型 
可能随时间变化因此，前面的讨论自然地引出了下述模型 

P 

C 1 + di + 之 t -1 + a !", 若々一】 < 71， 

<=1 

c .2 + ^2 + 02 z t -\ + a [ 2 \ 若 71 < Q - 1 < 72， (8.44) 

i=l 
V 

c 3 十 E 企 (/ Vt—i + /3 3 ^_i + 〜⑶，若 ％ < • 

其中 A = 1002；, 7, < 0 < 72 是两个实数， { aj °} 是彼此独立的二兀白噪声序列.这 
里我们用 2 t = 1002；,因为彳的实际值相对较小. 

(8-44) 式中的模型称为三体制的多元门限模型.两个实数 71 和 72 是门限， 
2 t - i 是门限 变量. 门限变量 2 ^是由数据支持的（参见 Tsay (1998)). 一般考虑 
{!>••• o }， 可以选择 Q - d 作为一个门限变量，其中 ri 0 是一个预先指定的正整 
数. 

模型 (8.44) 是第4章中门限自回归模型的推广.它也是 (8.33) 式中误差修正 
模型的 推广. 如前所提到的，只有当 <( 或等价地， 2 t ) 的模相当大时，套利交易才 
是有利可图的.因此模型 (8.44) 只有在体制1和体制3会有套利交易发牛.这样 
体制 2 中的 / u 与々间的动态关系主要是由正常市场力量决定的，从而两个序列 
或多或少类似于一个随机游走换句话说，中间体制的两个对数价格应该不受套利 
的 影响. 从而也不受协整的限制.从经济计量的观点看.这意味着中间 体制氏 的估 
计应该是不显著的. 

总之，我们期望期货的对数价格与现金市场上的证券指数的对数价格之间的协 
整效应在休制1与体制3中都是显著的，但是在体制2中不显著.这种现象称为门 
限协整.可参见 Balke 和 Fomby (1997). 

8.7.2 数据 

在下面的实例研究中使用的数据是 S&P500 指数在 1993 年 5 月的円内交易 
数据与它在芝加哥商品交易所的6月份期货合约.具体可参见 Forbes , Kalb 和 
Kofman(1999). 他们利用这个数据构造了一个具有 7 060 个观测值的每分钟的二元 
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价格序列.为了避免异常收益率的过渡影响，我们将10个异常值（每边5个）用与 
它们最近的两个值的简单平均来代替.这一步并不影响分析的定性结论，但是可能 
影响数据的条件异方差性.为了简便，我们在研究中不考虑条件异方差性.图8~16 
是指数期货和现金价格的对数收益率的时间序列图，与模型 (8.43) 相应的门限变 
量 q = 100 s ^. 

(a) 对数期货的1阶差分 

0.U01 
0.0 

- 0.001 

0 200() 4000 6()00 

时间指数 

(b> 对数价格的1阶差分 

0.002 

0 . 1 ) 

- 1).001 

0 2000 40(H) 6(X)0 

时 M 指数 

(C) 為序列 

D.2 
0.0 
- 0.2 

0 200() 4000 6(NH) 

时间指数 

图 8*16 1993 年 5 月 S & F 500 指数期货和现金价格的 1 分钟对数收益牟的时 faj 图及其 

相关的门限变量 .（a) 指数期货的对数收 益率； （b) 指数现金价格的对数收 益串； 

(c) 序列 

8.7.3 估计 

(8.44) 式中多元 fj 限模型的一个止式识别包括选择 N 限变量.决定体制个数 
以及对每个体制选择阶 P. 感兴趣的读者卩』以参考 Tsay(1998); Forbes, Kalb 和 
Kofrnan(1999). 我们可以利用一些信息准则（如 Akaike 信息准则 [AIC] 或残差的 
平方和）来估计门限71 和 72. 假定 p = 8, d E {l t 2,3,4} t 7 i e [-0.15,-0.02], 
72 € [0.025,0.145], 并利用格点搜索方法（每个区间内有 300 个点)， AIC 选择 
作为门限变量时，门限为卞= -0.022 6, 72 = 0.037 7. 参数估计的细节见表 8*8. 

由表8>8我们观测到如下几点.第一.中间体制中4的比表明，如我们所 
料,该估计在 5% 水平下不显著，从而证实了当不出现套利机会时，两个对数价格之 
间没有协整.第二，对所有三个体制 ，△力 都与负相关.这与第 5 章所讨论的 
买卖弹性是一致的.第三，指数期货的过去对数收益率看上去比现金价格的过去对 
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数收益率包含更多的信息，因为 △/,_<& ^貝有更显著的比.这是合理的, 
囡为一般来说，指数期货的流动性更强.关子指数套利的更多信息.可参见 Dwyer , 
Locke 与 Yu (1996). 


表 8-8 铪1993年5月的 S & P 500 指数数据拟合 （8.44) 式中的多元门限模型时参数的 


S 小二乘估计及它们的比 a 



体制 l 

休制 ‘2 

体制 3 



Aat 

A/« 

Aat 


Aat 

4>o 

0.0002 

0.00005 

0.00000 

0.00000 

-0.00001 

-0.00005 

t 

(1.47) 

(7-64) 

(-0.07) 

(0.53) 

(-0.74) 

(-6.37) 

A/t-i 

一 0.08468 

0.07098 

-0.03861 

0.04037 

-0.04 JU2 

U.023U5 

t 

(-3 83) 

(6.15) 

(-1.53) 

(3.98) 

(-1.72) 

(1.06) 


-0.00450 

0.15899 

0.04478 

0.08621 

一 0.02069 

0.09898 

t 

(-0.20) 

(13.36) 

(1.85) 

(8.88) 

(-0.87) 

(8.45) 


0.02274 

0.11911 

0.07251 

0.09752 

0.00365 

0.08455 

t 

(0.95) 

(9.53) 

(3.08) 

(10.32) 

(0.15) 

(7.02) 

A/ 卜 4 

0.02429 

0.08141 

0.01418 

0.06827 

-0.02759 

0.07G99 

t 

(0.99) 

(6.35) 

(0.60) 

(7-24) 

(-1.13) 

(6 37) 

A/ t _5 

0.00340 

0.08936 

0.01185 

0.04831 

-0.00638 

0.05004 

t 

(0.14) 

(7.10) 

(0.51) 

(5.13) 

(-0.26) 

(4.07) 

A/t-6 

u.oum)8 

0.07291 

0.01251 

0.03580 

-0.03941 

0.02615 

t 

(0.04) 

(5.64) 

(0.54) 

(3.84) 

(-1.62) 

(2.18) 


一 0.00372 

0.05201 

0.02 刪 

0 04837 

-0 02031 

0.D2293 

t 

(-0.15) 

(4.01) 

(1.34) 

(5.42) 

(-0.85) 

(1.95) 

A/t-a 

0.00043 

0.00954 

0.01812 

0.02196 

一 0.04422 

0.00462 

t 

(0.02) 

(0.76) 

(0.85) 

(2.57) 

(-1.90) 

(0.40) 


-0.08419 

0.00264 

-0.07018 

-0.05633 

0.00604 

0.11143 

t 

(-2.01) 

(0.12) 

(-1.70) 

(-314) 

(1 -刪 

(5.05) 

△St-2 

-0.05103 

0.00256 

一 o. 10920 

一 0.01521 

0.04099 

一 0.01179 

t 

(-118) 

( Oil ) 

(-2.59) 

(-0.90) 

(0.92) 

(-0.53) 


0.07275 

一 0.03631 

一 0.00504 

0.01174 

-0.01948 

-0.01829 

t 

(1.65) 

(-1.58) 

(_0.i2) 

(U.71) 

(-0.44) 

(-0.84) 

As 卜 4 

0.04706 

0.01438 

0.02761 

0.01490 

0.01G4G 

0.00367 

t 

(1.03) 

(0.60) 

(0.71) 

(0.96) 

(0.37) 

(0.17) 

△為 5 

0.08118 

0.02111 

0.03943 

0.02330 

-0.03430 

-0.00462 

t 

(1-77) 

( G .88) 

(0.97) 

(1.43) 

(-0.83) 

(-0.23) 


0.04390 

U.H456U 

0.01690 

0.01919 

0.06084 

一 0.00392 

t 

(0.96) 

(1.92) 

(0.44) 

(1-2S) 

(1.45) 

(-0.19) 

△S 卜 7 

-0.03033 

0.02051 

-0.08647 

0.00270 

-0.00491 

n.03SQ7 

t 

(-0.70) 

(0.91) 

(-2.09) 

(0.16) 

(-0.13) 

(1.90) 

一 8 

一 ().02920 

0.C3018 

0.01887 

-0.00213 

0.00030 

0.02171 

t 

(-0.68) 

<134) 

(0.49) 

(-U.14) 

(0.01) 

(1.14) 


0 00024 

0.G0097 

-0.00010 

0.00012 

0.00026 

0.00086 

t 

(1-34) 

(10.47) 

(-0.30) 

(0.86) 

(1-41) 

(9.75) 


a 三个体制的数据点分别为2 234. 2 410和2 408. 
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附录 A 向量与矩阵的回顾 


附录 A 主要回顾向量与矩阵的一些代数性质.这里没有给出证明，因为相关 
证明在关于矩阵的标准教科书（如 GraybiU , 1969) 中都可以找到. 

—个 rn x n 实值矩阵是一个由 m 行 n 列的实数组成的数组.例如， 

. 「2 5 8 - 
-13 4 

是一个 2 x 3 矩阵.该矩阵有2行3列.一般地,一个 m x n 矩阵可以写为 




Cl\2 • • • 

^1 ,n—1 


三 [^ij] ~ 

«21 

(122 • • • 

a 2，n — 1 

tt 2n 


^ml 

a m 2 … 

1 

a run 


(8.45) 


IH 整数 m 和 n 为 >4的 行數和列教. 实数称为 >4的第 ( i , j ) 个元素.尤其是，元 


素叫 是矩阵的 对角线元素. 

一个 m x 1矩阵形成一个 m 维列向量，且一个1 x n 的矩阵是一个 n 维行向 
S . 文献中的向量一般指列向量.如果 m = n ， 则矩阵是一个方阵.如果对于 
有 a l7 = 0,且 m = n , 则矩阵 <4为一■个对角矩阵.如果对于 i / j 有 a ,』 = 0,而且 
对所有的 i ， 有= 1.则 A 是一个 m x m 单位矩阵，通常用表示，或当维数 
清楚时简单表示为 /. 


n x m 矩阵 



an 

tl21 * " 

a m-l,l 

a ml 

A! = 

a 12 

(122 - 


tJ, m2 


ain 

fl2n … 

^m —l,n 

^hnn 


是矩阵 A 的转置.例如， 


2 -1 
5 3 

8 4 



的转置.我们利用记号 A ' = 


[ a ； j ] 来表示 A 的转置.由定义得出，且 (Ay = A. 如果 i =儿则 A 是 


一个对称矩阵. 


基本运算 


假设 A = [ a i7 ] mxn , C = f ^ l px < J 是两个矩阵，它们的维数在下标中给出.令6 
是一个实数.一些基本的矩阵运算定义如下. 

• 加法：如果爪=口且71 = 9,则 A + C = [aij 4- c ^] m xn ; 
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• 减法：如果 m = p，n = < 7 ,则 A - C = [ a ^- - Ci _,] mxn ； 

• 标量乘法： 6 A = [6 a , j ] mxn ； 

• 乘法：若 n = p , 则 AC * = 5 Z a rvC v j . 

- mxq 

当矩阵维数满足乘法的运算条件时，两个矩阵称为可相乘的 （ conformable ). 下 
式是矩阵乘法的一个 例子： 


2 1 


1 2 3 


2 x 1 — 1 x 1 2 x 2 -(- 1 x 2 2 x 3- 1 x 4 

1 1 


-1 2 -4 


1 x 1 - 1 x 1 Ix 2 + lx 2 1 x 3- 1 x 4 


16 2 
0 4-1 


矩阵运算的重要法则 包括： 

( a ) ( AC )， = C ' A '\ 

( b ) 一般情况下 ， AC 一 CA 

逆、迹、特征值与特征向量 

称方阵 A mxm 是非奇异的或可逆的，如果存在一个唯一的矩阵 C mxm , 满足 
AC = CA = I m , 其中，是 m x m 单位阵.在这个情形. C 称为 A 的逆矩阵, 
记为 C = A - 1 . 

的迹是它的对角线元素的和（即 tr(A) - f >„). 很容易看出 ： （ a ) 

tr(A + C ) = tr ⑷ + tr ( C ); ( b ) tr ( A ) = tr ( A '); ( c ) 假个矩阵是可相乘的，则 
tr ( AC ) = tr ( CA ). 

如果 Ab = Ab , 则数 A 与 m x 1 向量 b (可能是复值）就是矩阵4的一个 
右特征值与右特征向 量对. 矩阵 A 有 m 个可能的特征值.对实矩阵 A , 复特征 
值是共轭出现的.矩阵4是非奇异的当且仅当它的所有的特征值都不为0.用 
{ A,|i = 1，…， m } 表示特征值，则我们有 tr ( A ) = f ： X t . 另外，矩阵 A 的行列式 

i=l 

可以定义为 | A | = fi A t . 对矩阵行列式的一般定义，可以参见关于矩阵的标准教材 

i=l 

(如 GraybiU , 1969). 

最后，矩阵 Amxn 的秩是对称矩阵 AA 1 的非零特征值的数目.对一个非奇异 
矩阵九还有 

正定矩阵 

称方阵 A ( mxm ) 是一个正定矩阵，如果 （ a ) 4是对 称的； （ b ) 4的所有特征 
值都是正数.另外一种 定义： 如果对任何非零的 m 维向量 b . 都有> 0,则 A 
是正定矩阵. 
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正定矩阵4的有用性质包括： （ a ) A 的所有特征值都是正 实数; （ b ) 矩阵>1可 
以分解为 

A = P \ P \ 

其中 A 是一个包含 A 的所有特征值的对角矩阵 T P 是一个包括 A 的 m 个右特 
征向量的 m x m 矩阵.通常将特征值写为 A: > A 2 彡…彡 A m , 相应的特征向量 
e „--- , c m 满足 Ae , = 且— 1. 另外，如果特征值不同的话，这些特征向 
量彼此正交(即如果 i / j ， 则= 0). 矩阵 P 是-个正交矩阵，这个分解称为矩 
阵4的谱分解.例如，考虑简单的 2 x 2 矩阵 


它是正定的.简申的计算表明： 

' 2 1 
1 2 

因此，3与1是 S 的特征值,标准化的特征向量分别为(为，大) ’ 和 (士，-士 )'• 
很容易证明如下谱分解成立 





2 1 " 



75 


3 O' 

- 72 

^ . 


1 2 


- 72 

75 . 


0 1 


对于对称矩阵4,存在一个对角线上元素为1的下三角矩阵 JL 以及对角矩阵 
G , 满足 A - LGL '. 参见 Strang (1980) 的第1章.如果 Z 是正定的，则 G 的对 
角元素全是正的.在这种情形下，我们有 



a = lVg \ Zgl ' = lVg { lVgy , 

其中 lVg 又是一个下三角矩阡，其平方根是逐个元素取的.这个分解称为 a 的 
Cholcsky 分解，它证明了正定矩阵 A 可以对角化.因为 


L ^ AiL ')- 1 = L - X A { L - 1 )' = G . 


因为 I 是貝有单位对角元素的下三角矩咗，所以 iT 1 也是具有单位对角元素的下 
三角矩阵.再次考虑前面的2 x 2矩阵 S ， 容易验证 


L = 

满足 E = LGL \ 另外， 

L~ l = 


1.0 0.0 
0.5 1.0 

1.0 0.0 
-0.5 1.0 


2.0 0.0 
0.0 1.5 


且 = G 
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拉直与 Krormrker 积 

将 m x n 矩阵 A 用它的列写为 A = [ ai ，… , a n ], 定义拉直算于为 vec ( yl ) = 
( a / n a 2i --* ，<„)',它是一个 mn xl 维 向量. 对两个矩阵与 C 卿 A 与 C 7 
的 Kronecker 直积为 




• • • 


O^lnC 

A®C = 

"21C 

Cl22^-^ • • • 

• • 

• • 

a 2,n-lC 

d2nC 



am2C" … 

^m f n —1^ 

a.mnC 


u J mpxnq 

例如，假定 

。=[ 4 — 1 3 1， 

• -2 5 2 J 

则 vec(yl) = (2, - 1,1，3广 vec(C7) = (4, -2, -1，5,3,2)'，且 




8 

-2 

6 

4 

-1 

3 

A® C = 

-4 

10 

4 

-2 

5 

2 

-4 

1 

一 3 

12 

-3 

9 


2 

一 5 

-2 

-6 

15 

6 


假设维数是合适的 ： 则对上述两个算子，我们有下面有用的 性质: 

(1) —般地， A ® C ^ C ® A -, 

(2) {A®C) f = A' ®C'-, 


(3) ® (C7 十 £>) = /I ® C7 -f A ® D\ 


(4) (A® C)(F <S)G) = {AF)® (CG); 


(5) 如果 a 与 c 是可逆的.则 （a ® cy ^ = A - l < s > c- 1 ； 

(6) 对力 阵 A 和 C7, tr{ A ®C) = tr(i4)tr(C); 

(7) vec(A -f C) = vec (■/ 4) + vec(C); 

( 8 ) vec(ABC) = (C' ® A)vec(B)- 

(9) tr{AC) = vec(C / ) , vec(A) = vec(A’)’vec(C); 


(10) tr{ABC) = vec(>4 / ) , (C , ® /)vec(i?) = vec(A'Y(I<g) B)vec(C) 

=vec(J3 / ) , (>l , ® /)vec(C) = vec(B')'(J ® C)vec(A) 

=vec(C , ) , (B , ® I)vec(A) = vec(C , ) , (/ ® ,4)vec(J3). 

在多元统计分析中，我们经常处理对称矩阵.因此，可以很方便地将拉肓算子 
推广为半拉直算子，它包含了主对角线或其以下的元素.具体地，对一个对称方阵 
•<4 = 定乂 


vech ⑷ = (a; ， af 2 . ， … ， a ’ “)’， 
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(3) E 12 = 0 当且仅当心与 a; 2 独立 • 

(4) 随机变量 y = (x- M) ； S- l (x - /i) 服从自由度为 m 的 x 2 分布. 

(5) X !在给定 x 2 = b 下的条件分布也是正态的，即 

(ajila^ = 6) ~ 十 Si2S^ 2 1 — A*2)，Eli — ^ 12^22 ^2i]* 

最后一个性质在许多科学领域都很有用.例如，它形成了正态假定下的时间序列预 
测与递推最小二乘估计的基础. 

附录 C 一些 SCA 命令 

下面的 SCA 命令是在例 8.6 的分析中用到的. 

input xl,x2. file J m-gsln3-5301.txt* % Load data 
rl=ln(xl) % Take log transformation 
r2=ln(x2) 

miden rl,r2. no ncm. arfits 1 to 8. 

-- % Denote the model by v21. 
mtsm v21. series rl,r2. ® 

model <i-pl*b-p2*b**2)sexiea=c+(i-tl*b)noise• 
mestim v21. % Initial estimation 

pi (2 # 1)=0 % Set zero constraints 

cpl<2,l)»l 

p2(2 # 1)-0 

cp2(2,l)=l 

p2(2,2> =0 

cp2 (2,2) «1 
tl(2 # 1)*0 
ctl(2 # l)=l 

% Refine estimation and store residuals 
mestim v21. method exact. hold resi (rftfll , 


miden res 1, res 2. 
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练习题 

8.1 考虑 Morck JU . Company , Johnsou &; Jonhsou , General Electric , General Motors , Ford 
Motor C « mipany 以及价值加权指数从1恥0年1月至 11 W 9 年12月以百分比表示的月 
对数股票收益率，包括了红利支付.见文件 m - mrk 2 vw . txt . 它共有 G 列迀次序同前面罗 
列的 次序一 致. 

( a ) 计算数据的样本均值、样本协方差矩阵以及样本相关矩阵. 

(b) 检验零假设: Pl = … = p 6 = 0 .其中 p, 为数据的延迟 i 的交叉相关矩阵.基于 
5%显著水平推出结论. 

( c ) 这6个收益率序列间有引导迟关系吗？ 

S .2 圣. 路易斯联邦储备银行在它网页上出版所选择的利率及美国的金融数据.网 址是： 

http://research.stlouisfed.org/fred2/. 

考虑固定期限为1年和10年的国库券的月利率，时间从1953年4月至2000年10月 
共571个观 测值： 见文件 m - gslnl 0. txt . 利率是用百分比表示的. 

(a) 令^ = 7•，— r t , 为月利率 r, 的变化 ft 序列.对两个变 化垦序 列构造一个二元自回 
归模沏.讨论模型所蕴含的意义，并将模型转换为结构形式 

(b) 对两个变化量序列建立一个二元滑动平均模型.讨论这个模型所蕴含的意义.并与前 
面的二元 AR 模型的结果比较. 

8.3 再次考虑固定期限为1年和10年的国库券的月利率，时间从1953年4月至2000年10 
月共571个观 测值. 考虑数据的对数序列，并对序列建立一个 VARMA 模型.讨论所得 
模型蕴含的意义. 

8.4 再次考虑固定期限为1年和 1() 年的国库券月利率，时间从1953年4月至2000年10月 
共571个观测值.这两个利率序列是门限协整的吗？利用利差〜= r 10lt - n , t 作为门限 
变量，其中 r * u 招具有_定期限 i 年闲厍券利率.如果它们是门限协整的，对两个序列建立 
—个多元门限模型. 

8.5 二元 AR (4) 模型; c , - = 0„ + a t 是一个周期为4的特殊季节模型. { a ,} 是独立 

同分布的正态随机变置序列.均值为0,协方茇矩阵为 S . 这种季节模型在研究公司的季 
度收入时可能有用. 

(a) 假设; r, 是弱平稳的，试推导的均值向量与协方差矩阵. 

(b) 推导： r, 弱平稳性的充分必要条件. 

( cO 证明对 f > n , r £ =办 , r , 4 ,其中 r , 是〜的延迟为^的自协方差矩阵. 

8.6 二元 MA (4) 模增 X, =a,~ 0, a ,_ 4 是周期为4的另一个季节模型， {«,> 是独立同分布 
的正态随机变量序列，均值为0,协方差矩阵为 E . 试对 / = (),..• ,5,推导的协方差 
矩阵 IV 

8.7 考虑固定期限为1年和3佐的美国国库券1953年4月至 21)04 年3月的月利率.数据吋 
以从圣.路易斯联邦储备银行或者文件 n - gsln 3-5304 .txt (1 年期和3年期数据）获得. 
也可以参见例 8 . 6 , 其中它利用了一个更短的时间区间.这里我们直接利用利率序列而不 
作对数变换. 定义 xt = ( x «, x 2 t r , 其中是一年期利率，是3年期利率. 

( a ) 为该二元利牟序列识别一个 VAR 模型，并写卜所拟合的模型. 
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(b) 计算所拟合 VAR 模盟的脉冲响应凼数.用前 6 个延迟值就足够了 . 

(c) 利用所拟合的 VAH 模型计算利牟序列的向前 1 歩到向前 12 步预测，预测原点为 
•2U04 年 3 月 . 

(d) 当利用一个带限制的常数项时，这两个利率序列是协整的吗？在 5% 的显著水平下进 
行检验 . 

(e) 如果序列足协整的 . 给序列建立一个 ECM 模型，并写下所拟合的模型 . 

(f) 利用所拟合的 ECM 模型计箅利率序列的向前 1 步到向前 12 步预测.预测原点为 
2004 年 3 月 . 

(g) 比较分别由 VAR 模型和 ECM 模型所得到的预测 . 


参考文献 

Balke, N. S. and Komby, V. B. (1997), Threshold cointegration. Interyiattonal Economic lievtew 
38 ： 627 645. 

Rox ， G. R P. and Tian, G. C t (1977). A rHnnnical analysis of multiple time series. BiomfArika 64: 
355 366. 

Brenner, R. J. and Kroner, K. F. (1995). Arbitrage, cointegration, and testing the unbiasedness 
hypothesis in financial markets. Journal of Financial and Quantitative Analysis 30 ： 23 42. 

Cuciirant?, J. H. (1988). Huw big it* thu i aiuium walk in tlie GNP? Juuiiiul uj Political Ecunuiny 
96: 893-920. 

Dwyer, G. P. Jr” Locke, P” and Yu ， W. (1996). Index arbitrage and nonlinear dynamics between 
the S&P 500 futures and cash. Remew of Financial Studies 9: 301-332. 

Engle, R. F. and Granger, C. W. J. (1987). Co-integration and error correction representation, 
estimation and testing. Economntnca 55: 251 276. 

Forbes, C. S M Kalb, G. R. J-. and Kofman, P. (1999). Bayesian arbitrage throtihold analysis. 
Journal of Businesn & Economic Statistics 17: 364 372. 

Puller, W. A. (1976). hiiroduction to Statistical Time Series. Wiley, Hoboken, NJ. 

Graybill, F. A. (1969). Introduction to Matrices with Applications in Statistics. Wadsworth, 
Belmont* CA. 

Hannan, E. J. and Quinn, B. G. (1979). The determination of the order of an autoregression* 
Journal of the Royal Statistical Society Senes B 41: 190 195. 

Hillmer ， S. C. and Tiao ， G. C. (1979). Likelihood function of stationary multiple autorcgrcsHive 
moving average models. Journal of the American Statistical Association 74: 652 660. 

Hosking, J. R. M. (1980). The multivariate portmanteau statistic. Jom'ncd of the American 
Statistical Association 75: 602-608. 

Hosking, .1. R. M. (19RI). Lagrange-multiplier nf multivjiri«t.n timp «prip« moHels Journal of 

the Royal Statistical Society Series B 43: 219 230. 

Johansen, S. (1988). Statistical analysis of co-integration vectors. Journal of Economic Dynamics 
and Control 12 ： 231-254. 

Johansen, S. (1096). Likelihood Baaed Inference in Cointegrated Vector Error Correction Models. 
Oxford University Press, Oxford, UK. 

Johnson, R. A. and Widiern, D. W. (1998). Applied Multivariate Statistical Analysis, 4th edition. 
Prentice Hall, Upper Saddle River, NJ. 

Li, W. K. and McLeod, A. 1. (1981). Distribution of the residual autocorrelations in multivariate 





352 第 8 幸多元时间序列分析及其应用 


ARM A time series models. Journal of the Royal Statistical Society Series B 43 ： 231 239. 

Liitkcpohl, H. (1991). Introduction tu Multiple Tiint Series Analysis. Springer-Verlag，New York. 

Reinsd. G. 0. (19fW). FHp.TTir.ntM nf KiultivaTtate Time Srvip.s Analynig. Springer-Verlag, New York. 

Rcinsel, G. C. and Ahn, S. K. (1992). Vector autoregressive models with unit roots and reduced 
rank structure: estimation, likelihood ratio test, and forecasting. Journal of Time Series 
Analysis 13: 353-375. 

Stock, J. II. and WaL»un t M. VV. (1988). Ttesting for common trends. Journal of the American 
Statistical AnsryciatAon 83: 1097-1107 

Strang ， G. (1980). Linear Algebra and Its Applications, 2nd edition. Harcourt Brace Jovanovich. 
Chicago. 

Tiao, G. C. and Box, G. E. P. (1981). Modeling multiple time series with applications. Journal of 
thr American Statistical Assuciatiun T0: 802-810. 

Tiai>, C». C anrl r I'«ay, R. S (1989) Model specification in niultivariate time series (with discus¬ 
sions). Journal of the Royal Statistical Society Series B 51: 157-213. 

Tiao ， G. C” Fsay, R. S M and Wang, T. (1993). Usefulness of Hear transformations in multivariate 
time series analysis. Empirical Economics 18: 567 593. 

Tsiiy, R. S. (1991). Twu canonical forms for vector ARMA processes. Statistica Simca 1 : 247 269. 

Tsuy ， R. S. (IQ98). Testing and modeling multivariate threshold models. Journal of the American 
Statistical Association 93: 1188 1202. 

Tsay, R. S.. and Tiao, G. C. (1990). Asymptotic properties of multivariate nonstationary processes 
with applications to autorgressions. AnnaLs of Statistics 18: 220 250. 

Zivot ， E. and Wang, J. (2003). Modeling Ftnanctal Time Series with. S-Plus. Springer-Vcriag, New 
York. 




第 9 章主成分分析和因子模型 

许多金融组合包含多个资产，它们的收益率同时并动态地依赖于许多经济和金 
融变量.因此利用合理的多元统计分析方法来研究组合收益率的行为和性质很重 
要.然而.如前几章所述，对多元资产收益率的分析通常需要高维统计模型，而这些 
模型很复杂并且很难应用.为了使多元收益率的建模更加简单，本章讨论一些降低 
维数的方法来寻找这些资产的内在结构.一般来说，降低维数最常用的统计方法是 
主成分分析 ( PCA ). 我们的讨论也从该方法开始.实际中所观测到的收益率序列通 
常呈现出相似的特征，这使得人们相信它们是由共同的因素驱动的.这些共同的因 
素称为公共因子.为了研究资产收益率的共同形式和简化组合分析，许多文献给出 
了很多因子模型来分析多元资产收益率.本章的第二个目的是引进一些有用的因子 
模型，并说明它们在金融中的应用. 

有二种类型的因子模型可用来研究资产收益率.参见 Coimor (1995) 与 Carap ~ 
bell ， Lu 和 M a cKinl ay (1997) .第种类型是宏观经济因子模型.该模型利用宏观经 
济变量来描述资产收益率的共同的行为，其中，这些宏观经济变量包括 GDP 增长 
率、利率、通货膨胀率以及失业人数等.由于该类模型的因子可以观测，从而可以 
利用线性回归的力法米估计模型.第一种类型是基本面因于模型.该类模型用企业 
或资产的具体厲性来构建公共因子.例如企业规模、账面价值与巾场价值以及产业 
分类.第三祌类型是统计因子模型.该类模型把公共因子看成是需要用收益率序列 
估计的不可观测的变量或稳变量.本章将讨论这三类因子模型以及它们在金融中 
的应用 . Alexander (2001) 与 Zivot 和 Wang (2003) 也讨论了资产收益率的主成分 
分析和因子模型. 

本章的结构安排如下： 9.1 节介绍资产收益率的一般因子 模型; 9.2 节讨论宏观 
经济因子模型并给出一些简单的 例子； 基本面因子模型及其应用在 9.3 节中给出; 
9.4 节介绍统计因子分析最基本的方法——主成分分析（在多元分析中它是用来 
降低维数的 )； 9.5 节讨论正交因子模型，包括因子旋转及其估计，并给出了 例子； 最 
后， 9. fi 节介绍渐近主成分分析. 

9.1 因子模型 

假定有々个资产和 r 个时间周期 . ~表示资产 i 在第 < 个时间周期内的收益. 
因子模铟的一般形式为 

= + Pilflt + . .. + Pimfmt ^ it 1 之 =1， . .. ，^ = 1 ， •.. ，免， （ 9-1) 
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其中 《• 是常数表示截距， {/#[?• = 1 T ...， m } 是 m 个公共因子，是资产 i 在因 
子 j 上的负荷， e it 是资产 i 的个性因子. 

对于资产收益率，假定因子八= ，/ m < ) '是 m 维平稳过程，满足 

E= (/ t )= A*/t 

COv (/ t ) = S /, m x m 矩阵. 

资产的个性因子 e tt 是白噪声序列，并且与公共因子人,和其他个性因子不相关.具 
体地，我们假定 


Cov(f it ,ei a ) = 0, 
Cov ( e “ ，£•>) = ■[ 


所有的 i 和*， 

所有的 j, 和 .9 ， 

< t ?， 若 i = j •且 t = s ， 
0，其他. 


因此，公共因子与个性因子不相关，并且个性因子之间也是不相关的.然而在一些 
因子模型中并不要求公共因子之间是不相关的. 

在某些应用中，资产的个数 A : 可能比时间周期的个数 T 大. 我们将在 9. G 节分 
析这样的数据.在因子分析中通常假定因子之间是序列不相关的，从而 r , 也是序 
列不相关的.在应用中，如果观测到的收益率序列是序列相关的，则可以用第8章 
的模型消除序列相关性. 

(9.1) 式的因子模型可以写成下述矩阵 形式： 


r it — a* 十 (3'ift + e»t, 

其中汍= 03 n , …， /3, m y ， f 时刻 a ： 个资产的联合模型是 


r t = ot + (3f t -\-e t , * = 1, - • - , T, (9.2) 

其中 r t = ( r lt ，... , r kt y , /3 = [/3 0 ] 是 A : x m 因子负荷矩阵， = (〜，… At )， 是 
误差向量且 Cov ( e t ) = D = diag { o -?,-.- , a \} 是 /c x k 对角矩阵.从而，收益率 
的 协方差矩阵为 

Cov ( r t ) = /3 H f (3' -f D . 

如果因子/ ^ 是可以观测的，则 （9.2) 式的这种模型表示具有横截面回归的形式. 

把 （9.1) 式的因子模型看作时间序列，对第 i 个资产我们有 


= otilT + i ^/3 j + £? j , (9.3) 

其中 ft , = ( n ! ，… , r iT y , i = 1，."， k 、1 T 是所有元素都为 1 的: T 维向量 . F 是 
7 1 x m 矩咗且其第 f 行是 /' M 丑,= ( eii ， … ,£ irY - Ei 的协方差矩阵 Cov ( JBi ) = af I 
是: Txr 对角阵. 

最后， (9.2) 式可改写为 


rt =冰 + £ t ， 
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其中 A = ( l,/；) ， ,C = [« 1 /3] 是 fcx ( m +1) 矩阵.对上式取转置并把所有的数据放 
在一块，则可以得到 

^ = + E, (9.4) 

其中 丑 是: T x A: 收益率 矩阵， 其第 * 行是 r {， 或等价地其第 i 列是由 （ 9.3) 式定义 
的 R l; G 是 r x (m + 1) 矩阵，其第 t 行是£是 ： T x 个性因子矩阵.其第 f 
行是 岭 如果公共因子/,可以观测.则 （ 9.4) 式是多元线性回归模型 （ MLR) 的一 
种特殊 形式. 参见 Johnsori 和 Wichern (2002). 对于 一 般的 MLR 模型，不要求 e, 
的协方差矩阵是对角阵. 


9.2 宏观经济因子模型 

由于宏观经济因子模型中的因子是可以观测的，从而可以利用最小二乘方法來 
估计 (9.4) 式的 MLR 模型.估计为 


d 


(G'Gr^^R), 


从中可以很容易地得到 a 和 /3 的估计. (9.4) 式的残差为 


E = R - G ^. 

基于对模型的假定， q 的协方差矩阵可以由下式 估计: 


D = diag(£J E/(T — m — 1)), 

其中 diag ( A ) 表示由矩阵 A 的对角线元素所构成的对角矩阵.进一步地， （9.3) 式 
中第个资产的矿为 


R-sqiiiiro, 


[ e ' e ],.., 




其中表示矩阵4的第 （ i ， i ) 元. 

泮意到先前的估计并没有要求个性因子 eit 彼此不相关.因此一般来说所得到 
的估计不是有效的.然?^加上正交化限制经常需要大量的计算.而且通常是可以忽 
略的-我们可以检査 m 1) 的非对角线元素来验证所拟合模型的充分 
性. 


9.2.1 单因子模型 

金融中最著名的宏观经济因子模型是市场模型.参见 Sharpe (1970). 该市场 
模型就是下述单因子 模型： 


Tit = + PiTMi + e it , i = A :; t =!,••♦ , T , 


(9.5) 
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其中是第 i 个资产的超额收益率 . 是市场的超额收益率.为了进一步说明. 
考虑13只股票的月收益率并日把 S & P 500 指数的收益率作为市场收益率.表 9-1 
给出了所用到的股票及其代码.样本区间是从 1990 年 1 月到 2003 年 12 月，因此 
k = 13,T=168. 我们利用二绂市场上的三个月期国库券的月收益作为无风险利率 
来计算股票和市场指数的超额收益.这些收益率均以百分比的形式给出. 


表 9-1 单因子模型分析中所用到股票及其代码 1 


Tick 

Company 


Tick 

Company 

r(^r) 

AA 

Alcoa 

1.09(9.49) 

KMB 

Kimberly-Clark 

0.78(6.50) 

AGE 

A.G. Edwards 

1.36(10.2) 

MEL 

Mellon Financini 

1.36(7.80) 

CAT 

Caterpillar 

1.23(8.71) 

NYT 

New York times 

0.81(7.37) 

F 

Ford Motor 

0.97(9.77) 

PG 

Procterfe Gamble 

1.08(6.75) 

FDX 

FedEx 

1.14(9.49) 

TRB 

Chicago Tribune 

0.95(7.84) 

CM 

General Motors 

0.64(9.28) 

TXN 

Texas Instrument 

2.19(13.8) 

HPQ 

Hewlett- Packard 

1.37(0.42) 

SP5 

S&P500 index 

0.42(4.33) 


a 衣屮还给山了超额收益宇的样本均值和样本标准差. 样本区 间是从1990年1月到2003年12月. 


我们用 S - Hus 来执行上一小节所讨论的估计方法.所用的大部分命令都能在 
免费软件 R 中应用. 

> da=matrix(scan(file= # m-fac9 003 .txt # ) # 14) 

> x»t(da) 

> xmtx=cbind(rep(1 # 168),x[,14]) 

> rtn=x[,l:13] 

> xic . hat = solve ( xmtx , rtn ) 

> beta.hat=t(xit.hat[2, ] } 

> E.hat=rtn-xmtx% # %xit.hat 

> D.hat=diag(crossprod(E.hat) / (168-2)) 

> r. square-1- (1G0-2) ♦D.hat/diag (var (rtn, OumGquares^-T)) 

> t (rbind (beta . hat:, sqrr ： (D. hat) , r . ©qtiare)) 



beta.hat 

sigma(i) 

r.square 

AA 

1.292 

7.694 

0.347 

AGE 

1.514 

7.808 

0.415 

CAT 

0.941 

7.725 

0.219 

F 

1.219 

8.241 

0.292 

KDX 

O.BUb 

8.854 

0.135 

GM 

1.046 

8.130 

0.238 

HPQ 

1.628 

9.469 

0.358 

KMB 

0.550 

6.070 

0.134 

MEL 

1.123 

6.120 

0.388 

NYT 

0.771 

6.590 

0.205 

PG 

0.469 

6.459 

0.090 

TRB 

0.718 

7-215 

0,157 

TXN 

1.796 

11.474 

0.316 


下 It ] 给出 f 第 / 个资产收益率的 /3 i ， crf 和 R 2 的估计. 

图 9-1 给出了 13只股票久和炉的条形图.金融股票 AGE 和 MEL 以及高 
科技股票 HPQ 和 TXN 似乎有较高的/3和/? 2 .另一方面. KMB 和 PG 有较低的 
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々和/? 2 . /? 2 的变化范围是从 U . ( W 到 0.41. 这表明市场收益对每只股泉变化的解 
释少于 5 U %. 


( a ) H 



A A AGE CAT F FDX GM HPQ K\1B MELNYT PC TRB TXN 

( b ) R 3 



图对 13 只股票的月超额收益拟合单因子模型时和/ ? 2 的条形图： （ a ) 0的条 形图； （ b ) 
rt 2 的条形图. S & P 500 指数的超额收益率作为市场 指数. 样本区间是从1990年1月 
到2003年12月 


在市场模型中， r t 的协方差矩阵和相关矩阵可以如下 估计： 

> cov.r=var(x[,14])♦(t(beta.hat)%*%beta.hat}+diag(D.hat) 

> ad . r^sqrt(diag ( cov . r) ) 

> corr.r=cov.r/outer(sd.r,sd.r) 

> print(corr.r,digits=l,width=2) 

AA AGE CAT F FDX GM HPQ KMB MEL NYT FG TKB TXN 


AA 

1 

0 

0 

4 

0 

3 

0 

.3 

0 

2 

0 

3 

0 

4 

0 

2 

0 

4 

0 

1 

0 

.7 

0 

2 

0 

3 

AGE 

0 

4 

1 

0 

0 

3 

0 

3 

0 

2 

0 

3 

0 

4 

0 

2 

0 

4 

0 

3 

0 

2 

0 

3 

0 

4 

CAT 

0 

3 

0 

3 

1 

0 

0 

3 

0 

2 

0 

2 

0 

3 

0 

2 

0 

3 

0 

2 

0 

1 

0 

2 

0 

3 

P 

0 

3 

0 

3 

0 


l 

0 

0 

2 

0 

3 

0 

3 

0 

2 

0 

3 

0 

2 

0 

2 

0 

2 

0 

3 

FDX 

0 

2 

0 

2 

0 

2 

0 

2 

1 

0 

0 

2 

0 

2 

0 

1 

0 

2 

0 

2 

0 

1 

0 

1 

0 

2 

GM 

0 

3 

0 

3 

0 

2 

0 

3 

0 

2 

1 

0 

0 

3 

0 

2 

0 

3 

0 

2 

0 

1 

0 

2 

0 

3 

HPQ 

0 

4 

0 

4 

0 

3 

0 

3 

0 

2 

0 

3 

1 

0 

0 

2 

0 

4 

0 

3 

0 

2 

0 

2 

0 

3 

KMB 

0 

2 

0 

2 

0 

2 

0 

2 

0 

1 

0 

2 

0 

2 

1 

0 

0 

2 

0 

2 

0 

1 

0 

1 

0 

2 

MEL 

0 

4 

0 

4 

0 

3 

0 

3 

0 

2 

0 

3 

0 

4 

0 

2 

1 

0 

0 

3 

0 

2 

0 

2 

0 

3 

NYT 

0 

3 

0 

3 

0 

2 

0 

2 

0 

2 

0 

2 

0 

3 

0 

2 

0 

3 

1 

0 

0 

1 

0 

2 

0 

J 

PG 

0 

2 

0 

2 

0 

1 

0 

2 

0 

1 

0 

1 

0 

2 

0 

1 

0 

2 

0 

1 

1 

0 

0 

1 

n 


TRB 

0 

2 

0 

3 

0 

2 

0 

2 

0 

1 

0 

2 

0 

2 

0 

1 

0 

2 

0 

2 

0 

1 

1 

0 

0 

2 

TXN 

0 

3 

0 

4 

0 

3 

0 

3 

0 

2 

0 

3 

0 

3 

0 

2 

0 

3 

0 

J 

0 

2 

0 

2 

l 

0 


我们可以将所估计的超额收益率的协方差矩阵和相关矩阵与其样本协方差矩 
阵和样本相关矩阵进行比较. 

> print ( cor ( rtn ) # digits = l , width = 2 ) 

AA AGE CAT F FDX GM HPQ KMB MEL NYT PG TRB TXN 
AA 1.0 0.3 0.6 0.5 0.2 0.4 0.5 0.1 0.4 0.4 0.X 0.3 0.5 
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AGE 0.3 1.0 0.3 0.3 0.3 0.3 0.3 0.3 0.4 0.4 0.2 0.2 0.3 

CAT 0.6 0.3 1.0 0.4 0.2 0.3 0.2 0.3 0 . 4 0.3 0.1 0.4 0.3 

F 0.5 0.3 0.4 1.0 0.3 0.6 0.3 0.3 0.4 0.4 0.1 0.3 0.3 

FDX 0.2 0.3 0.2 0.3 1.0 0.2 0.3 0.3 0.2 0.2 0.1 0.3 0.2 

GM 0.4 0.3 0.3 0.6 0.2 1.0 0.3 0.3 0.4 0.2 0.1 0.3 0.3 

HPQ 0.5 0.3 0.2 0.3 0.3 0.3 1-0 0.1 0.3 0.3 0.1 0.2 0.6 

KMB 0.3 0.3 0.3 0.2 0.3 0.3 0.1 1.0 0.3 0.2 0.3 0.3 0.1 

MEL 0.4 0.4 0.4 0.4 0.2 0.4 0.3 0.4 1.0 0.3 0.4 0.3 0.3 

NYT 0.4 0.4 0.3 0.4 0.3 0.2 0.3 0.2 0.3 1.0 0.2 0.5 0.2 

PG 0.1 0.2 0.1 0.1 0.1 0.1 0.1 0.3 0.4 0.2 1.0 0.3 0.1 

TRB 0.3 0.2 0.4 0.3 0.3 0.3 0.2 0.3 0.3 0.5 0.3 1.0 0.2 

TXN 0.5 0.3 0.3 0.3 0.2 0.3 0.6 0.1 0.3 0.2 0.1 0.2 1.0 

在金融中，可以利用全局最小方差组合 ( GMVP ) 来比较给收益率所拟合因子 
模型的协方差矩阵与收益率的样本协方差矩阵.对于给定的协方差矩阵 S ， 全局最 
小方差组合 U ； 是下述最优化问题 的解： 


rnin = u / Eu ;， 满足 u/l = 1. 


解之可得 


UJ 


S _1 1 


其中 l 是元素全为 l 的 fc 维向量. 

对于所考虑的市场模型.所拟合模型和数据的 GMVP 如下: 


> w.gmin.model=solve(cov.r)%*%rep(1 # nrow(cov.r)) 

> w.gmin.model=w.gmin.model/sum(w.gmin.model) 

> t(w.gmin.model) 

AA AGE CAT P FDX GM 

tli] 0.0117 -0.0306 0.0792 0.0225 0.0802 0.0533 

HPQ KMB MEL NYT PG TRB TXN 

[1J -0.0354 0.2503 0.0703 0.1539 0.2434 0.1400 -0.018B 

> w.gmin.data=solve(var(rtn))%*%rep(1,nrow(cov•r)) 

> w.gmin.data=w.gmin.data/sum(w.gmin.data) 

> t(w.gmin.data) 

AA AGE CAT F FDX GM 

[1J -0.0073 -0.0085 0.0866 -0.0232 0.0943 0.0916 

HPQ KMB MEL NYT PG TRB TXN 

[1,] 0.0345 0.2296 0.0495 0.1790 0.2651 0.0168 -O.OOfiO 


比较两个 GMVP. 给予 TRB 股票的权重变化很大.然而，这两个组合都给予 
KMB, NYT 和 PG 股票较大的权重. 

最后我们检査残差的协方差矩阵和相关矩阵以验证 13 只股票的个性因子不相 
关的假定.下面给山了残差相关矩阵的前四列，且在残差的交叉相关矩阵中有取 
较大值的元素，例如 Cor(CAT,AA) = 0. 45 和 Cor(GM,F) = 0.48. 

> reai.cov=t(E.hac)%*%E.hat/(16b-2) 

> resi.sd=sqrt(diag.cov)) 

> resi.cor=resi.cov/outer(resi.sd,reai.sd) 

> princ(resi.cor,digi lb*!, widch*2) 
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AA 

AGE 

CAT 

F 

FDX 

GM 

HPQ 

KMB 

MEL 

KYT 

PG 

TRB 


AA 

AGE 

CAT 

F 

1-00 

-0.13 

0.45 

0.22 

0.13 

1.00 

-0.03 

-0.01 

0.4b 

-0.03 

1-00 

0.23 

0.22 

-0.01 

0.21 

1.00 

0.00 

0.14 

0.05 

0.07 

0.14 

-0.09 

0.15 

0.48 

n .P.4 

-0.13 

-0.07 

-0.00 

0.16 

0.06 

0.18 

0.05 

0.02 

0.06 

0.09 

0.10 

0.13 

0 10 

0.07 

0.19 

0.15 

-0.02 

-0.01 

-0.07 

0.12 

-0.02 

0.25 

0.16 

0.19 

-0.17 

0.09 

-0.02 


9.2.2 多因子模型 

Chen ， Roll 和 Ross (198 G ) 考虑了股票收益率的多因子模型.所用的因子包括 
宏观经济变量的不可预知的变化或意外.这里不可预知的变化表示移除宏观经济 
变量动态依赖后所得到的残差得到不可预知的变化的一个简单方法是为宏观经 
济变量拟合一个第8章中的 VAR 模型.为了进一步说明，考虑下列两个月宏观经 
济变量. 

(1) 城市居民的消费价格指数 ( CPI )： 包括所有项的指数，且指数 1982-1984- 

100 . 

(2) 16 年及以上城市就业人数 （ CE1G): 以千记. 

CPI 和 CE 16 都己经进行了季节凋整.数据的时间区间是从1975年1月到 2 U(Ki 
年12月.我们用更长的时间区间来得到变量的意外序列.对于这两个序列，我们 
通过取刈数序列的一阶差分构造增长率序列.增长率序列以百分比的形式给出. 

为了得到意外序列.我们用 hUU 准则米识别 VAR (3) 模型.这样，因于模型中 
所用的这两个宏观经济因子都是对数据拟合 VAR (3) 模型时从1990年到2003年 
的 残差. 对于超额收益率序列，我们仍然考虑前面所用到的13只股票.下面给出 
了分析的细节： 

> da=matrix(scan(file= , m-cpicel6-dp7503.txt r ),2) 

> cpi=da 【 1 ,] 

> cen=da[2,] 

> xl = cbind ( cpi # cen ) 

> yl = data . frame ( xl ) 

> ord. choice-VAR (yl, max. ax*=13 ) 


> ord.choice$info 
ar (1) ar (2) 

BIC 36.992 38.093 

ar (3) 
28.234 

ar (4) 
46.241 

ar(5) 

60.677 

ar (6) 

75.810 

ar (7) 
BIC 86.23 

ar (8) 

99.294 

ar (9) 

111.27 

ar<10> 

125.46 

ar(11) 

138.01 

ar(12) ar(13) 
146.71 166.92 


> var3.fit=VAR(xl-ar(3)) 

> res=var3.fit$residuals 【 166:333,1:2 】 

> da=matrix(scan(file= ， m-fac9003. txt* ) # 14) 
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> xmtx = cbind(rep(l,168),res) 

> (da) 

> rtn - da [,1：13] 

> xit .hat=»solve (xmtx.rtn) 

> beta.hat*t(xit.hat|2：3 # ]) 

> E.hat=rtn - xmtx%*%xit.hat 

> D.hat=diag(crossprod(E.hat) / (168-3)) 

> r. oquare-1 (168 3) 4 D . hat/diag (var (rtn # GutnSquarea-T)) 

图 9 2 给出了 13 只股票的 /3 和 /? 2 估计的条形图.有趣的是，所有的超额收 
益率与 CPI 增长率的不可预知的变化都是负相关的.这看起来是合理的.然而，所 
有超额收益率的7? 2 都很低，这说明这两个宏观经济变量对这13只股票超额收益 
率的解释能力很低. 

CP1 意外的 beta CE1G 意外的 bctn W 



14-12-10-8-6-4 -2 0 -4 -2 0 2 0.0 0.02 (1.04 0.06 


图 9*2 对13只股票的月超额收益率拟合二因子模型时0和 fl 2 的条形图.样本区间是从 
1990年1月到2003年12月 

用下面的命令可以得到该二因子模型的协方差矩阵和相关矩阵的 估计： 

> cov.rtn=beta .hat%*%var (res) %*%t (beta .hat) -i-diag (D. hat) 

> sd.rtn=sqrt(diag(cov.rtn)) 

> cor.rtn = cov.rtn/outer(sd.rtn,sd.rtn) 

> print(cor.rtn,diits-1,width-2) 

相关矩阵非常接近于单位矩阵，表明所用的二因子模型并不能很奵地拟合这些 
超额收益率.最后，下面给出二因子模型残差的相关矩阵. 

> cov.resi=t(E.hat)%*%E.hat/(168-3) 

> sd.resi=sqrt(diag(cov.resi)) 

> cor•resi=cov•resi/outer(sd.resi,sd.resi) 

> print(cor.resi # digits-l,width= 2 ) 
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如所料想.该相关矩阵非常接近干前而由原始超额收益率序列给出的相关矩 
阵 ： 故此处略去. 

9.3 基本面因子模型 

基本而闵子模型用资产的可观测的具体属性构建公共因子来解释超额收益率. 
这些具体属性包括产业分类、企业规模、市场资本化、账面价值以及风格分类（增 
长宇或值).对于基础因子模型.文献中有两种方法.第一种方法是由 BARRA 公司 
的创立者 Bar Rosenberg 提出的.称为 BARRA 方法.参见 Crinold 和 Kahn (20 n «). 
与宏观经济因子模型相反，该方法将观测到的资产的具体基本面作为因子久.在每 
个时刻 A 通过回归的方法估计因子 /,. beta 不随时间改变，但是/,随时间演变.第 
二种方法是由 Fama 和 Prench (1992) 提出的 Fama French 方法.在该方法中，刈 
于给定的具体基本面，通过基于该具体基本面构造刈冲组合来得到因子/+下面 
两小节中，我们简要讨论一下这两种方法. 

9.3.1 BARRA 因子模型 

假定超额收益率是均值修正的，从而因子实现也是均值修正的， (9.2) 式的因子 
模型退化为 

rt. = /3f t + et , (9.6) 

其中 ft 表示（样本）均值修正后的超额收益率序列，为了符号上的简化，这里继续 
用/,作为因子 实现. 由于是给定的， (9.6) 式是有 A 个观测和 m 个未知量的多 
元线性回归.由于公共因子的数目 m 应该小于资产的数目 A :. 从而回归是可以估计 
的. 然而，回归不是齐次的，因为£>的协方差矩阵£> = diag {< r ?, ••- , al \ 依赖于第 
i 个资产.这里 a ; 2 = Var ( e „). 因此，时刻^的因子可以通过加权最小二乘 ( WLS ) 
方法估计，且权重为个性因子的标准误差.这样得到的估计为 

U = (9.7) 

在实际中协方差矩阵£>是未知的，从而估计时需要两个步骤 

第一步，在每个时刻 /. 利用普通最小二乘 ( OLS ) 方法得到/,的一个初步估计 

如下 

其中第二个下标《表示 OLS 估计.该因子实现的估计是相合的但不是有效的. OLS 
回归的残差是 

E t.O = Pft ， o- 

由于残差的协方差矩阵不随时间变化，从而我们可以将所有的残差放在一起（即对 
于 * = 1，"- , r ) 来得到 D 的估计 
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D 0 = diag 


T 




第二步，我们将估计亡„嵌入以得到因子实现的修正估计 

/e, s = ^'b~^)-\(3'b~ X l3r t ), (9.8) 

其中第二个下标 p 表示广义最小二乘 ( GLS ) 估计，是 WLS 估计的一个样本版本. 
修正后回归的残差为 

= rt- 0ft, g , 

由此我们可以估计残差的协方差矩阵 

D a = diag I 幻〜心 )} . 

最后被估因子实现的协方差矩阵为 


S / 


1 


T 


T 


其中 


'-a ~ / ； /)(/ t,g - f n)' 


j：hr 


支 9 _ t 

t=l 

由 （9.6) 式在 BARRA 方法下，超额收益率的协方差矩阵为 


Cov ( r t ) = /3E^3 7 +Dg. 

1. 产业囚于模型 

为了进一步说明，考虑10只股票的超额收益率，并用产业分类作为具体的资 
产基本面.表 9-2 给出了所用的股票.它们可以分为3个产业类别，即.金融服务、 
计算机和高科技以及其他类别.样本区间仍然是从1990年1月到2003年12月. 
在 BARRA 的框架下，有三个公共因子表示这三个产业类别，且 beta 是这三个产 
业类别的指示变量.即 


Tit = + Pi2f2t + Pi3f3t + £it, i= I, ••- ,10, (9.9) 


beta 为 


f 1, 若资产 i 属于第:/个产业区 
1 0，其他 


(9.10) 


其中 j = 1.2,3 分别表示 金融， 高科技和其他类别.例如， IBM 股票收益字的 beta 
向 M 为 沭 — (0,1, 0) ; , Alcoa 股票收益的 beta 向量为 /3, = (0,0,1)，. 
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表 9-2 产业因子模型分析中用到的股票及其代码 " 


Tick 

Company 

r(«Tr) 

Tick 

Company 

r(«7 r ) 

A(；I 

C 

A. G. Edwards 
Citigroup 

1.36(10.2) 

2.08(9.60) 

IBM 

International Business 
Machines 

1.06(9.47) 

MWD 

Morgan Stanley 

1.87(11.2) 

AA 

Alcoa 

1.09(9.49) 

MER 

Merrill Lynch 

2.08(10.4) 

CAT 

Caterpillar 

1.23(8.71) 

DELL 

HPQ 

Dell Inc. 
Hewlett-Packard 

4.82(16.4) 

1.37(11.8) 

PC 

Procter&Gnmble 

1.08(0.75) 


a 超额收益率的样本均值和样本标准差也在表中给出.柞本时间区间是从1990年1月到2003年12月. 


(9.9) 式中， / lt 是金融服务类的因子实现，/ 2 ,是计算机和高科技类的因子实现, 
ht 是其他类的因子实现•因为汰:,是指示变量.所以的 OT,S 估计非常简单.事 
实上，是由时刻每个类别的超额收益率的平均值构成的向量.具体地， 


ft 


,o 


AGEf + 0( -f - MDW i -f- MER^ 
~~ 4 

DELL t + HPQ, + TDM, 


AA t + CAT f + PG t 


第 i 个资产的个性因子仅仅是其超额收益率与其所属产业类样本均值的差.于是 
可以得到残差协方差矩阵 D 的估计，并由此得到广义最小二乘估计 . 我们用 S-plus 
进行分析 . 首先 , 将收益率加载到 S-plus 中，移除掉样本均值.创建产业类哑元并计 
算收益率的样本相关矩阵 . 

> da=matrix(scan{file=,m-barra-9003.txt*) , 10) 

> rm = matrix(rowMeans(da),1) 

> rtn.rm = da - t(rm)%*%rep(1,168) 

> fin = c(rep(1,4),rep(0,6)) 

> tech = c(rep(0,4).rep(1,3),rep(0,3) 

> oth = c(rep(0,7),rep(1,3)) 

> ind.dum = cbind(fin,tech,oth) 

> ind.dum 

fin tech oth 
[1,] 100 
[2,] 100 
[3,] 100 

【 4,] 100 

[ 5 ,] 010 

[ 6 ,] 010 

[7, ] 0 10 

[8,] 0 01 

[9, ] 0 0 1 

[10,] 001 

> rtn=t(rtn.rm) 

> cov. rtn=vax- (rtn) 

> sd.rtn=sqrt(diag(cov.rtn)) 

> corr•rtn=cov.rtn/outer(sd.rtn,sd.rtn) 

> print(corr.rtn,digits=l.width=2) 
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AGE 

C 

MWD 

MER 

DELL 

HPQ 

IBM 

AA 

CAT 

PG 

AGE 

1.0 

0.6 

0.6 

0.6 

0.3 

0.3 

0.3 

0.3 

0.3 

0.2 

C 

MWD 

0.6 

1.0 

0.7 

0.7 

0.7 

ft .4 

0.4 

0.4 

0.4 

0.1 

0.6 

0.7 

1.0 

0.8 

0.3 

0.5 

0.4 

0.4 

0.3 

0.3 

MER 

0.6 

0.7 

0.8 

1.0 

0.2 

0.5 

0.3 

0.4 

0.3 

0.3 

DELL 

0.3 

0.2 

0.3 

0.2 

1.0 

0.5 

0.4 

0.3 

0,1 

0.1 

HPQ 

0.3 

0.4 

0.5 

0.5 

0.4 

1-0 

0.5 

0.5 

0.2 

0.1 

IBM 

0.3 

0.4 

0.4 

0.3 

0.4 

0.5 

1.0 

0.4 

0.3 

-0.0 

AA 

0.3 

0.4 

0.4 

0.4 

0,3 

0.5 

0.4 

1.0 

0.6 

0,1 

CAT 

0.3 

0.4 

0.3 

0.3 

0.1 

0.2 

0.3 

0.6 

1.0 

0.1 

PG 

0.2 

0.3 

0.3 

0.3 

0.1 

0.1 

-0.0 

0.1 

0.1 

1.0 


下面给出了 OLS 估计、残差和残差的方差估计. 

> F.hat.0 = solve(crossprod(ind.dum))(ind.dum)%*%rcn.rm 

> E.hat.o = rtn.rm - ind.dum%♦ % F.hat.o 

> diagD.hat.o=rowVars(E.hat.0) 

接下来便可以得到广义最小二乘估计. 

> Dinv.hat = diag(diagD.hat.o A (-1)) 

> HI = t(ind.dum)%^%Dinv.hat%*%ind.dum 

> Hmtx=solve (HI)%*%t <ind.dum)%*%Dinv.hat 

> F.hac.g = Hmtx%*%rtn.rm 

> F.hat.gt=t(P.hat.g) 

> E.hat.g = rtn. rtn - ind. dum% # %F. hat .g 

> diagD.hat.g * rowVars(E.hat.g) 

^ t (Hmtrx) 



fin 

tech 

oth 

tij 

0.1870 

0.0000 

0.0000 

[2,1 

0.2B48 

0.0000 

0.0000 

[3J 

0.2586 

0.0000 

0.0000 

[4,] 

0.2995 

0.0000 

0.0000 

[5,] 

0.0000 

0.2272 

0.0000 

[6,] 

0.0000 

0.4015 

0.0000 

[7,] 

0.0000 

0.3713 

0.0000 

【 8 ,】 

0.0000 

0.0000 

0.3319 

[9.] 

0.0000 

0.0000 

0.4321 

[ 10 ,】 

0.0000 

0.0000 

0.2360 


> cov.ind=ind.dum%*%var(F.hat.gc)%*%t(ind.dum) + 
• 4 - diag (diagD . hat . g) 

> sd.ind=sqrt(diag(cov.ind)) 

> corr.ind=cov.ind/outer(sd.ind,sd.ind) 

> print(corr.ind,diqits-1,width-2) 



AGE 

C 

MWD 

MER 

DELL 

HPQ 

IBM 

AA 

CAT 

PG 


AGE 

1.0 

0.7 

0.7 

0.7 

0.3 

0 

.3 

0 

• 3 

0 . 

3 

0 

• 3 

0 , 

3 

C 

0.7 

1.0 

0.8 

0.8 

0.3 

0 

.4 

0 

.4 

0 . 

3 

0 

.3 

0 . 

3 

MWD 

0.7 

0.8 

1.0 

0.8 

0.3 

0 

.4 

0 

.4 

0 . 

3 

0 

.4 

0 . 

3 

MER 

0.7 

0.8 

0.8 

1.0 

0.3 

0 

• 4 

0 

• 4 

0 . 

3 

0 

.4 

0. 

3 

DELL 

0.3 

0.3 

0.3 

0.3 

1.0 

0 

.5 

0 

.5 

0 . 

2 

0 

• 2 

0 . 

2 

HPQ 

0.3 

0.4 

0.4 

0.4 

0.5 

1 

.0 

0 

.7 

0 . 

3 

0 

.3 

0 . 

2 

IBM 

0.3 

0.4 

0.4 

0.4 

0.5 

0 

,7 

1 

.0 

0. 

3 

0 

.3 

0. 

2 

AA 

0.3 

0.3 

0.3 

0.3 

0.2 

0 

• 3 

0 

, 3 

1. 

0 

0 

.7 

0 . 

5 

CAT 

0.3 

0.3 

0.4 

0.4 

0.2 

0 

.3 

0 

.3 

0 . 

7 

1 

.0 

0 . 

6 

PG 

0.3 

0.3 

0.3 

0.3 

0.2 

0 

.2 

0 

.2 

0 , 

5 

0 

.6 

1 . 

0 
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由模型得到的产业类内的股票的相关矩阵要比样本相关矩阵大.例如，股票 
CAT 和 PG 的样本相关系数只有0.1，但是基于所拟合模型得到的相关系数是 0.6. 
图 9 3 给出了基于广义最小二乘估计给出的因子实现的时间图. 


(n) 因 7■• 实 现： 金融类 




(C) 其他类 



图 y - 3 对三个产业类的10只股票拟合 BARRA 产业因子模型所估计的因子实现 
2. 囚于模拟组合 

考虑带单因子的 BARBA 因子模型这种特殊情况.这里 （9.7) 式给出 的力的 
WLS 估计提供了很好的 解释. 考虑 k 个资产的组合 u ; = ( Wll ... . u k y . 该组合是 
下述最小化问题 的解： 

miu ,满足 uf '(3 = 1. 

该组合问题的解由下式 给出： 

因此，被估因子实现是如下组合的收 益率： 

ft = 

如果将组合 u ; 标准化，即满足 f ： a ;, = 1，则称之为因子模拟组合.对多个因子的情 
况，可以对每个因子单独应用想. 

注释： 在实 际中. 超额收益率的样本均值经常与 【） 没有显著的区别.因此，在 
拟 合一个 BARRA 因子模型之前.诵常不需要移除样本均值 □ 
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9.3.2 Fama-French 方法 

对一个给定的资产基本面（例如账面价值与巾场价值的比率)， Kama 和 French 
(1992) 使用两个步骤来决定因子实现.首先，他们基十观测到的基本曲的值将资产 
分类.然后他们构造了一个对冲组合.该组合持有分类资产前® 1/3的多头，且持 
有分类资产后面2/3的空头.对于给定的资产基本面，< 时刻所观测到的该对冲组 
合的收益率就是所观测到的因子实现.对于所考虑的资产基本面重复上面的步骤. 
最后.给定观测到的因子实现 { f t \t = 1，…， r }, 并用时间序列的回归方法来估计 
每个资产的 beta . 为了解释超额收益率变动性的高百分比, Fama 和 French 确认了 
三个观测到的基本面.他们所用的三个基本面是 （ a ) 全部的市场收益率（市场超额 
收益 率)； （ b ) 与大股票相关的小股票的业绩 ( SMB , 小的减掉大 的)； （ c ) 与成长型股 
票相联系的价值型股票的业绩 （ HML ， 高对低).通过市场资产净值和市场资产净值 
对账面资产净值的比率来定义价值型股票和成长型股票.账面资产净值对市场资 
产净值的比率髙的股票称为价值型股票. 

注释： 不同因子模型中因子的概念可能不同.在 Fama-FVench 方法中所用的三 
个因子是三个全融基本面.也可以将这些基本面组合起来构成股票的一个新的属 
性，并将所得到的模型看作箏因子模型.这里之所以这样是因为所用的模型是线性 
统计模型.因此，在因子模型中当提到因子的个數时应该特别注意.另一方面.对 
于因子的个數.统计因子模型中有相当好的定义 • 下面我们将对此进行讨论. 口 


9.4 主成分分析 


在多元时间序列分析中，一个重要的问题是对序列的协方差（或相关系数）结 
构的研究.例如，问量收益率序列的协力差结构在组合选择屮起着很重要的作用. 
下面，我们讨论一些统计方法.它们在研究时间序列的协方差结构时非常有用. 

给 定一个 it 维随机向量 r = (ry , r fc y , 其协方差矩阵为 则主成分分析 
(principal component analysis , 简记为 PCA ) 关心的是利用 r , 很少的线性组合来解 
释 I 的结构.如果 r 表示 fc 个资产的月对数收益率，则可用 PCA 来研究这 fc 个 
资产收益率变化的原因.这里关键词是很少，从而使得多元分析可以获得简化. 

9.4.1 PCA 理论 

PCA 对 r 的协方差矩阵或相关矩阵 p ,. 都适用.因为相关矩阵是标准化 
随机变量 r * = S ~ l r 的协方差矩阵，此处 S 是 r 的分量的标准差组成的对角矩阵, 
所以在我们的理论分析中使用协方差矩阵.令叫=表示&维向量， 
这里 i = l ， …， A :. 那么 

k 

Vi ， - y^u^rj 
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是随机向量 r 的线性 组合. 若 r 由只股票的简单收益率组成，则讲是对笫 j •只 
股票赋子权重之后所形成的组合的收益率.因为将乘上个常数井不影响 

分配到第 j 支股票上的权重，所以我们将向量 a 标准化，使得 w ： u； t = f ： <4 = 1 . 

利用随机变量线性组合的性质,我们有 J_1 

Var{yi) = i = l ，."， fc ， (9.11) 

Cov ^ yuyj ) = i，j = l ,...， k . ( 9 . 12 ) 

PCA 的思想就是找到线性组合 u ；, 使得对 i 爹 j 有 yi 与 y 3 是不相关的，并且％的 
方差尽可能大.更具 体地： 

(】） r 的第一个主成分是在= 1 的限制下，使得 Var ( yi ) 最大的线性组合 
Vi = uj \ r ; 

( 2 ) r 的第 一 个主成分是在 u ； 2U>2 = 1 与 Cov (^ 2i J / i ) = 0 的限制下，使得 Var ( i / 2 ) 
最大的线性组合: V2 = 

( 3 ) r 的第 i 个主成分是在 = 1 与 Cov ( j /<, yj ) = 0, j = 1, • •.，i -1 的限 
制 F , 最大化 Var(i/i) 的线性组合 i/i = 

因为 S r 的协方差矩阵是非负 定的. 所以它具有谱分解（见第 8 章附录 A ). 令 
( Ai ， ei ) … （ Afc , e *：) 为 XJ r 的特征值（特征向量组)，其中 A ! > A 2 彡…彡 A * 彡 0 ’ 贝 1 J 
我们有下面的统计结果. 

结果 9.1 r 的第/ 个主成分是讥 = ek = E eijTj，i = 1 , •• - , k . 而且 

i=i 

Vax(t/i) = eJZJre, = A,, i=l ， ... ， A :， 

Cov ( yi , yj ) = e - E r e > = 0 , i ^ j . 

如果某些特征值 A , 是相 等的. 则对应特征向 量 e < 的选择不是唯一的，从而 
也不是唯一的.另外.我们有 


作 a 

Varl > i ) = tr ( S f ) = H A « = Var ( yi ). 


(9.13) 


等式 (9.13) 说明 


A , 


Vtir(y，） _ _ 

EVar ( r ,)~ + 


因此， r 的总方差中由第 i 个主成分解释的比例是 & 的第； 个特征值占 S T . 的所 

有特征值总和的 比率. 也可以计算由前 v 个主成分所能解释的总方差的累枳比例 

•• k 


(即& 从 U 娜中， 可以选择-个较小 I 使得前 面的累 积比例很大. 
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因为 tv ( Pr ) = k , 所以当采用相关阵来进行主成分分析时，由第 i 个主成分解 
释的方差比例变为 K / k . 

PCA 的一个副产品是 5^ 或&的 0 特征值表明 r 的分量之间存在精确的 
线性关系.例如，如果最小特征值 4 = 0, 则由结果 9.1 知 Var( Z/fc ) = 0. 因此， 

y k = {: c k ： i rj 是个常数.从而在 r 中只有 A : — 1个随 机鐘. 在这种情形下， r 的维 
数可低.由于这个原因.文献中常用 PCA 作为降低维数的工具. 

9.4.2 经验的 PCA 


应用中，收益率向量 r 的协方差矩阵 S r 和相关矩阵 p ,. 是未知的，但在一些 
正则性条件下.它们可以通过样本协方差矩阵和样本相关矩阵相合地估计.假定收 
益率是弱平稳的，且数据为 = 则我们有如下 估计： 

T T 

t r = [a iJtr J = (r t - f)(r t - r)', r = (9.14) 

— 1 e=i t=i 

p r = S l t r S \ (9.15) 


其中左 = 是由 n 的样本标准差构成的对角矩阵.从而 
口了以利用计算对称矩阵的特征值和特征向量的方法来进行主成分分析.现在大多数 
统计包都能进行丰成分分析.在 S ~ Plus 中，进行主成分分析的基本命令是 princomp , 
在 FlnMctrics 中则为 mfactor . 

例 9.1 考虑 IBM , Hewlett - Packard , Intel Corporation , Merrill Lym.li 与 Morgan 
Stanley Dean Witter 从 1990 年 1 月至 1999 年 12 月的月对数收益率.此收益率以 
百分比表示.且包括红利.数据集共有120个观测值.图9 4给出了这5种月收益 
率序列的时间图.如所料想，同一工业部门的公司收益率倾向于展现出相似的模式. 

用 7〃=( IBM , HPQ , INTC , MER , MWD ) 表示这些收益率，其样本均值向量为 
(1.47,1.97,3.05,2.30.2.36)', 样本协方差矩阵和样本相关矩阵为 



73.10 


36.48 

103.60 



27.08 

48.86 

113.96 


16.06 

37.59 

27.96 

105.56 

16.33 

40.72 

26.86 

85.47 109.91 


1.00 


Pr = 


0.42 1.00 

0.30 0.45 1.00 

(1.18 0.36 0.2 G 1.00 

0.18 0.38 0.24 0.79 1.00 
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阁 9*4 以下5个公司月对数收益率的时 间图. 其中对数收益率以百分比表示且包含分红，时 
间区间是从 1990年 1 月至 1999年 12 月： ( a ) IBM ; ( b ) Hewlett - Packard ; ( c ) Intel ; 
( d ) Merrill Lynch : ( e ) Morgan Stanley Dean Witter 


表 o - 3 给出了利用协方差矩阵和相关矩阵进行主成分分析的结呆.还给出了特 
征值、特征向量以及由主成分解释的变化比.考虑相关矩阵，并用又和&来表不 
样本特怔值与特征向量.对前两个主成分.我们有 

= 2.456, ^ = (0.342,0.474,0.387,0.503.0.505)', 

人2 = 1.145. e 2 = (0.525,0.314,0.405, -0.481, -0.48 iy . 

这两个成分大约解释了数据全部变化的 72%, 旦它们具有有趣的 解释. 第一个成 
分是股票收益率的一个大致为等权重的线性组合.这个成分可能代表股票巾场的一 
般运动，从而是一个市场 成分. 第二个成分代表两个工业部门 （ 即技术和金融服 

务）的差.它可能是个工业成分.利用 r 的协方差矩阵也可以发现主成分的类似 
解释. 

应用中确定主成分个数的一个非正式但是很有用的方法是检査斜坡图 （scree 
plot ). 它是特征值按由大到小次序排列之后的时间图（即 心对 i 的图).图 9-5 a 
给出了例 9 .1 屮的 5 种股票收益率的斜坡图.通过在斜坡图中寻找转弯处，这表明 
余下的特征值相对较小并大致看上去是相同的，所以我们可以选择一个恰当的主 
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成分的个数.对图心5的两个图来说，两个主成分看起来是合适的.最后，除了对 
j > i 有 A , = 0的情形，选择前 i 个主成分仅仅提供了数据总方差的一个近似.如 
果一个很小的 i 可以提供一个好的近似.则这种简化是有价值的. 


表 9-3 对 IBM, Hewlett-Packard, Intel, Merrill Lynch 与 Morgan Stanley Dean 
Witter 从 1990 年 1 月至 1999 年 12 月的月对数收益宇进行主成分分析的结果 •* 

利用样本协方笼矩阵 


特征值 

比例 

祺积 

特征向 S 

250.1C 

0 506 

0.506 

0.246 

0.461 

0.409 

0.522 

0.536 

110.14 

0 229 

0.736 

0.327 

0.3(50 

0.585 

-0.452 

-0.467 

04.91 

0.128 

0.864 

0.586 

0.428 

-0.G83 

-0 082 

一 0.036 

40.82 

0 093 

0.956 

-0.700 

0.687 

-0.153 

-0 115 

-0.042 

22.11 

0 044 

1.000 

0.018 

-0.050 

0.033 

一 0-710 

0.701 

利用样本相关阵 

特征值 

2.456 

1.145 

0.699 

0,495 

0.205 

比例 

U.491 

0.^9 

U.14U 

au9y 

U.041 

粜积 

0.491 

0.720 

0.860 

0.969 

1.000 

特征向鼠 

0.342 

0.525 

0.691 

-0.362 

-0,012 


0.474 

0.314 

一 0.043 

0.820 

0.050 


0.387 

0.405 

-0.717 

-0.414 

一 0.034 


0.503 

-0.481 

0.052 

-0.147 

0.701 


0.505 

-0.481 

0.071 

-0.062 

-0.711 


H 特征 向煨进 以列 向鼠形式给 Ml 的 


(a) 5 个股票收益率 (1») 5 个债券指数收益率 



m 9-5 两个 5 维资产收益半的斜坡图 ： （ a) 例 9.1 中的序列 ： （ b) 例 9.3 中的债券指数收益率 

注释： 将例 9.1 中的数据扩展到 2003 年 12 月，对扩展后的数据进行主成 
分分析所得到的结果与例 9.1 中给出的结果基本一样，因此略去了.下面给出了在 
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S - Plus 中进行主成分分析的命令. S - Plus 给出了特征值的平方根，并将其作为标准 
差. 

> da=matrix(scan(file= # m-pca5c-9003.txt*),6) 

> rtn = t(da[1:5,]) 

> pea.cov = princomp(rtn) 

> names(pea.cov) 

> summary(pea.cov) 

> pea.cov$loadings 

> ocrecplot(pea•cov) 门 


9.5 统计因子分析 

我们现在转向统计因于 分析. 多兀统计分析中的一个主要困难是“维数的祸 
害”. 特别地，当模型的阶或时间序列的维数增加时，参数模型的参数数量也经常陡 
增.通常要寻找简化方法来克服维数所带来的祸害.从实证的观点出发.多元数据 
经常表现出一些相似的模式，这表明数据中存在潜藏的共同结构.统计因子分析是 
文献中可以利用的简化方法之 一. 它的目的是识别几个因子，使得它们能够解释数 
据的协方矩阵差与相关矩阵中的绝大部分变化. 

传统的统计因子分析假定数据没有序列相关性.由于金融数据经常是以小于 
或等于一周的频率抽取的，所以经常违反这个假定.然而，这个假定对低频数据的 
资产收益率（如股票或市场指数的月收益率）看卜去是合 理的. 如果违背了这个假 
定，则可以利用本书中讨论的参数模型消除数据的线性动态依赖，并对残差序列应 
用因子分析 

下面.我们讨论基于正交因子模型 (orthogonal factor model ) 的因子分析.考 
虑第*期知个资产的收益率=(〜，••• ,r kt ) f , 并假定 r t 是弱平稳的，其均值 
为//，协方差矩阵为 S r . 因子模型假定线性地依赖丁少数不可观测的随机变量 
ft ~ (/ u » f'lii • ■ • 1 fmt ) 1 ~j ^ 维附加噪声 et = ..., 这里 m < fc , ffi 是公 

共因子， £, t 是误差.数学上,统计因子模型具有 （ y . i ) 式的形式，只是用均值收益 /x 
代替截距 a . 因此因子模型有如下形式 

- /i = f } f t + e t , (9.16) 

具中 /3=[^ Uxm 是因子负荷矩阵 • 是第 i 个变量在 j 个因子上的负荷，^是 
n , 的个性 误差. 统计因子模型的一个关键特征是 m 个因子/,,和因子负荷都 
是不可观 测的. 正因为如此， (9.16) 式不是一个多元线性回归模型.尽管它看上去 
与多元线性回归模型相似. 

称 (9.16) 式的因子模型是一个正交因子模型，如果它满足下面的 假定： 

(1) E (/ t ) = 0, Cov (/,) = / m 为 m x m 的单位 矩阵： 

(2) E ( e ,) = 0, Cov ( e ,) = D = diag { a ?，... ，< 7 艺} (即 £) 是 A: x fc 对角矩阵)； 



372 第 9 章主成分分析和因子模型 


(3) / t 与 是独立的，从而 Cov(f t ,E t ) = E ( f t e f t ) = O mxk . 

在上述假定下,很容易看出 

S r = Cov ( r t ) = E [( rt — ti ){ rt — nY ] 

= E{Wt + e t )((3 f t + e t y ] =(3 潷 + D (9.17) 

且 

Cov ( r t ,/J = E [( r t - + E ( e «/ t ) = ^ (9.18) 

利用 (9.17) 式和 (9.18) 式，我们 看出对 (9.16) 式中的正交因子模型 

Var ( r it ) = ^ + • • • + 0 f m + of , 

Co\(rn r Tji) — Pilftjl + • • • + 0tni0jrn > 

Cov ( r w? f jt ) - Pij. 

由 m 个公共因子贡献的 r it 的方差部分 - 称为共性方差 （ Communality ). 

r it 方差的剩余部分 d 称为唯一性方差或个性方差.令4 = 婼+…&为共 
性方差，它 是第〗 个变量对 m 个公共因子的负荷的平方和.分量 r , t 的方差变为 
Var ( r it ) =cf + 

实际中，并非每个协方差矩阵都具有正交因子表示.换句话说，一个不具有任 
何正交因子表示的随机变量 r , 是存在的.而且，随机变量的正交因子表示并不唯 
—. 事实上，对任何满足 PP' = P'P = J 的 m x m 正交矩阵令= (3P, 
/；=广/„则 

r t -n = Pf t + e t = 0 PP ' f t + e t = 0* ft + e t . 

另外 E (/；) = 0, Cov (/；) = P f Cov(/ t )P= P P = I. 这样 ， /r 和 /; 对 r t 建立了 
另一个正夂因于模型.正交因子表示的这种不唯一性既是缺点，又是因于分析中的 
一个优点.说它是缺点是因为它使得因于负荷的意义不确定了.它也是一个优点， 
因为它允许我们进行旋转来寻找具有良好解释的公共因子.因为 P 是一个正交矩 
阵，所以 变换厂 = P '/ t 是 m 维空间中的一个 旋转. 

9 . 5.1 估计 

(9.16) 式中的正交囚子模型可以通过两种方法估计.第一种方法利用前一节中 
的主成分分析.这个方法不要求数据的正态性假定，也不要求预先指定公共因子的 
个数.它对协力差矩阵和相关矩阵都是适用的.但是同 PCA 中所提到的一样，这 
个解通常只是一个近似.第二种估计方法是最大似然方法.它利用正态密度，并要 
求顸先指定公共因子的个数. 
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主成分方法 


再次令 ,(^, e fc ) 是样本协方差矩阵 i ： r 的特征值和特征向量对，其 
中人1 > ^2 > ... ；> Afc • ♦ m < k 为公共因子的个数，则因子负荷矩阵由下式给出 

^ = i ^ ij ] = ， (9.19) 


个性方差的佔计是矩阵 ij r - 的主对角线上的兀素.即/? = diagfa ?,... ^2^ 

其中 # = 1；^ ， &是&的第 （M) 个 元素. 共性方差的估计为 


€ = 忠 + …+ • 


由近似产生的误差矩阵为 

S r -(^ + D ). 

我们当然希望这个矩阵接近于 0. 可以证明 - (卢 〆 + D ) 的元素的平方和小于 
或等于 Aj l+1 +…+ ^.因此，近似误差的上界为所忽略的特征值的平方和 • 

由 (9.19) 式 的解. 基于主成分方法的因子负荷估计并不随着公共因子 m 的增 
加而改变. 

最大似然方法 


如果公共因子/,和个性因于是联合正态的，那么 r < 是多元正态的，且其 
均值为 M 、 协方差矩阵为 S r = + D . 在 j 3 , D 1 /3= A (它是一个对角矩阵）的 
限制下，可以利用最大似然方法得到/3和£>的估计.这里 p 是由样本均值估计的. 
对这个方法的细节，读者可以参考 Johnson 和 Wichern (2002). 

在利用最大似然方法时.公共因子的个数必须事先给定.在实际中，可以用修 
正的似然比检验来检査所拟合的 m - 因子模型的充 分性. 检验统计量是 

1 2 1 

LR(?n) = - T - 1 - 百 (2A ： 十 5) --m (In |S r | - In |/9/3'+ £>|). (9.20) 

在 w 个因子的零假设下，上述检验统计量的渐近分布是自由度为 - [( k - m ) 2 - k - m ] 
的卡方分布.我们将在 9. G .1 小节讨论选择 m 的一些方法. 2 

9.5.2 因子旋转 


正如前面提 到的. 对任何 m X 771 正交矩阵 _ P , 


r t - fJ . = (3 f t + £/ = fi ' + 

其中 f 3 - = /3 P , f ； = P r f t . 另外， 

I D = ppp f f3 , + D = (3*(/3*y + D. 

这个结果 说明： 共性方差与个性方差在正交变换下保持不变.因此寻找一个正交 
矩阵 P 来变换因子模型使得公共因子具有良好的性质就是合理的.这样一个变 
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换等价于将公共因子在 m 维空间中旋转.事实上，有无限个可以利用的因子旋转. 
Kaiser (1958) 提出了一个方差最大化准则 （Varimax criterion ) 来选择 旋转. 这在许 
多应用中都运作地很好.记是旋转后的因子负荷矩阵， c ? 表示第 i 个共 
性方差. 定义所』= /?*/. ： .为经过共忡方差 （ TH ) 平方根的尺度变换之后的旋转系 
数.方差最大化方法是选择对角矩阵 P ， 使得下式最大化 

这个复杂的表示有一个简单的解释.最人化 V ，对应于尽可能多地分散每个囚子负 
荷的平方.因此，此方法是为 r 在因于负荷的旋转矩阵的任何列屮寻找大的但可以 
忽略联合功效的组.在实际应用中，使用因于旋转来帮助解释公共因于.这在一些 
应用中可能有益，但在其他应用中未必有用.对十因+旋转有许多吋用的准则. 

9.5.3 应用 

给定资产收益率的数据 { n }， 因子分析使得我们能够找到一些公共因于来解 
释收益率变化.由于因子分沂假定数据没有序列相关性.所以在使用因于分析前应 
该检验这个假定的正确性.为此，我们可以使用多元混成统计量.如果发现有序列 
相关性，则可以构造一个 VARMA 模型来消除数据中的动态相依性.并且对残差序 
列运用因子分析.对许多收益率序列，线性模型残差的相关矩阵经常非常接近于原 
始数据的相关矩阵.在这种情形下，动态依赖对因子分析的影响是可以忽略的. 

本小节考虑3个例子.前2个例子用 Minitab 软件进行分析，第3个例子用 
S - Plus 分析. 也可以用其他程序包. 

例 9.2 再次考虑例 9.1 中使用的 IBM , HewLett - Parkard , Intel . Merrill Lynch 和 
Morgan Stanley Dean Witter 的月对数股票收益率.为了检验序列不相关的假设.我 
们计算混成统计量得到 Q 5 (l) = 34.28, g 5 (4) = 114.30, Q s (8) = 216.78. 与自由度 
为 25, 10() 和 200 的 x 2 分布比较，这些检验统计量的值分别是 0.102,0.156 和 
0.198. 因此，即使在 10% 的水平下都不能拒绝序列无关的假设. 

表 9-4 给山了基于相关矩阵运用主成分方法和最大似然方法的因子分析结果. 
我们假定共同因子的个数是 2. 根据例 9.1 中的主成分分析，这种取法是合理的.从 
表中可见，因子分析揭示了几个有趣的发现. 

• 由主成分方法识别的两个因子比最人似然方法识别的因子解释了更多的变 
差. 

• 根据旋转后的因于负荷，两种方法对数据基本上识别了同样的两个公共因子. 
金融股 （Merrill Lynch 和 Morgan Stanley Dean Witter ) 对第一个因子的负 
荷很大.而技术股 （ IBM , Hewlett - Packard 和 Intel ) 对第二个因子的负荷很 
大.这两个旋转后的因子联合区分了工业部门. 
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员大似然法 

0.087 

0.247 

0.141 

0.769 

0.976 


0.524 

0.755 

0.551 

0.232 

0.186 


0.191 

0.394 

0 . 25(1 

0.800 

().994 


1.881 

0.376 


0.987 

0.197 


1.632 

().326 


1.236 

0.247 



共性方差 



0.602 

0.665 

0.556 

0.8M7 

0.891 


3.601 

0.720 


0.282 

0.630 

0.323 

0.645 

0.988 


2.8 H 8 

0.574 


变量 


IBM 

HPQ 

INTC 

MER 

MWD 

比 


IBM 

HPQ 

INTC 

MER 

MWD 


变录 

比例 


a 收益率包含分红，时间是从：990年 i 月到1999年 L2 月. 分析基于样本交叉相关阵并假定有两 
个公共因 T. 

例 9 . 3 在这个例子中.我们考虑期限为30年、20年、10年、5年和1年的美国 
债券指数的月对数收益率•例 9 .2中描述过这个数据，但被转换成了对数收益率.总 
共有696个观测值.正如例 9 .2中显示的，数据具有序列依赖性.然而，通过拟合一 
个 VARMA (2 J ) 模细来消除序列依赖几乎不对同步相关矩阵具有任何影响.事丈 
h , 拟合一个 VARMA ( 2 ，1) 模型之前和之后的相关矩阵分别为 

' 1.0 1 f 1.0 " 

0.98 1.0 0.98 1.0 

Ad - 0.92 0.91 1.0 ， p — 0.92 0.92 1.0 , 

0.85 0.86 0.90 1.0 0.85 0.86 0.90 1.0 

_ 0. fi 3 0 64 0 67 0.81 1.0 J [ 0 66 0 .67 0.71 0.81 1.0 

其中& 是原始对数收益率的相关 矩阵. 因此，我们直接对收益率序列应用因子 
分析. 

表 9-5 中给出了数据因子分析的 结果. 对两种估计方法，前两个公共因子对数 
据总力差的解释都超过了 90%.事实上，高的共性方差说明对五种债券指数收益 


0.229 


0.491 


• 在这个特例中，方差最大化的旋转并没有将最大似然方法识别的两个因子改 
变 很多. 然而由主成分方法识别的第一个非旋转因子被旋转去掉了.根据方 
差最大化准则背后的思想，这并不奇怪. 

• IBM 和 Intel 股票基于最大似然方法的收益率的个件方差相当大，从而暗示 
了这两只股票有一些特征值得我们进一步研究. 

表 9-4 IBM, HewLett-Packard } Intel, Merrill Lynch 和 Morgan Stanley Dean 
Witter 的月对数股累收益率的因子分析 a 


9 1 2 5 
9 8 17 1 
4 G 5 o o 

do.o.o.d 
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最大似然法 


-0.513 

0.895 

().430 

0.985 

-0.486 

0.876 

0.451 

0.970 

一 0.303 

0.744 

0.584 

0.895 

0 .00() 

0.547 

0.837 

1.000 

0.123 

0.342 

0.747 

0.675 


牛:成分法 


0.253 

0.927 

0.333 

0.970 

0.240 

0.922 

0.345 

0.968 

0.140 

0.860 

0.429 

0.934 

-0.142 

0.704 

0.660 

0.931 

—0.585 

0.325 

0.936 

0.982 


« 时间是从 1942 年 1 月到 1999 年 12 月 . 分析堆丁样本交叉相关阵，假定有两个公共因了 . 

例 9.4 再一次考虑表 9-2 中的10只股票的月超额收益率.时间区间是从1990 
年1月到2003年12月，收益率以百分比的形式给出.我们的目的是用 S - Plus 命 
令 factanal 演示一下统计因子模型的应用.我们从二因子模型开始,但是 (9.20) 式 
的似然比检验拒绝了二因子模型的假设.检验统计暈是 LR ⑵ =72.96. 基于自由度 
26的渐近卡方分布，检验统计量的 p 值接近为零. 

> da=matrix(scan(file= ’ m-barra-9003.txt # ).10) 

> rtn^t(da) 

> stat.fac=factanal(rtn,tactors=2 # method^ # nUe*) 

> stat.fac 

Sums of squares of loadings : 

Factorl Factor2 
2 . 2.19149 

Component names : 

M loadings n "uniquenesspR " M r.nrrplat ion * 1 "criteria M 
"factors" "dof H "method" "center" "scale" "n.obs” 
w scores" M call M 


变童 3.918 0.607 2.538 1.987 4.525 

比例 0.784 0.121 0.608 0.397 0.906 


4.281 0.504 3.059 1.726 4.785 

比例 0.856 0.101 0.612 0.345 0.957 


因子负荷的佔计 


旋转因子负荷 


共性方差 


率而言，其个性方差都非常小.因为两种方法的结果接近，故我们只讨论主成分方 
法.非旋转因子负荷说明： （ a ) 所有5种收益序列对第一个因子的负荷粗略地 相等; 
( b ) 对第二个因子的负荷与期限长短是正相关的.因此，第一个公共因子代表了一 
般的美国债券收益率.第二个因子体现了 “期限”效应.而且，第二个因子负荷的和 
接近于 0. 因此，这个公共因子也可以解释为长期债券与短期债券的比较.这里一 
个长期债券指的是期限为 1() 年或更长的债奍.对旋转后的因子.其负荷也是有趣 
的.对第一个旋转因子的负荷与期限成正比例，而对第二个闵子的负荷与期限成反 
比例. 

表 9-5 期限为 30 年、 20 年 .10 年、 5 年和 1 年的美国债券指数的月对数收益率的因子分析 


9 7 6 0 3 
4 5 9 0 1 
88 8500 
0.O.O.1.O. 


年年年年年 

0 0 0 5 1 
3 2 1 


2 4 G 5 o 
5 P0 5 5 0 
9 9 9 9. 8 

o.d do.d 


年年年年年 

0 0 0 5 1 
3 2 1 
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接着应用一个三因子模型，在 5 %的显著性水平下该模型似乎是合理的. LR ⑶统 
计量的 p 值是 0.089 2. 


> stat.fac=factanal(rtn # factor-3 # method= , mle , ) 

> stat.fac 

Test of the hypothesis that 3 factors are sufficient 
versus the alterudtive that more are required : 

The chi square statistic is 26.48 on 1R degrees of freedom. 
The p-value is 0.0892 

> summary(stat.fac) 

Importance of factors ： 



Factorl 

Factor2 

Factor3 

SS loadings 

2.635 

1.82b 

1.326 

Proportion Var 

0.264 

0.183 

0.133 

Cumulative Var 

0.264 

0.446 

0.579 

Uniquenesses : 

AGE C 

MWD MER 

DELL HPQ 

IBM 

0.479 0.341 0. 

201 0.216 

0.690 0.346 

0.638 


AA CAT PG 
0.417 0.000 0.885 


Loadings : 



Factorl 

Factor2 

Factor3 

AGE 

0.678 

0.217 

0.121 

C 

0.739 

0.259 

0.213 

MWD 

0.817 

0.356 


MER 

0.819 

0.329 


DELL 

0.102 

0.547 


HPQ 

0.230 

0.771 


IBM 

0.200 

0.515 

0.238 

AA 

0.194 

0.546 

0.497 

CAT 

PG 

0.198 

0.331 

0.138 

0.970 


因子负荷也可以用下述命令 > p l 0 t (loadings (stat • fac )) 在图上表示出来，即图 
m 从阁中可以看出因子1本质上代表佥融服务类，而因子2主耍由商科技类 
和 Alcoa 股票的超额收益率构成，因子 3 很大程度上依赖于 CAT 股票和 AA 股票 
的超额收益率.因此代表剩余的产业股. 

用命令 rotate 可以进行因子旋转.该命令允许许多种旋转方法.由命令 predict 
可以得到因子实现. 


> stat.fac2 = rotate(stat.fac,rotation= , quartimax # ) 

> loadings(stat.fac2) 

Fartorl Factor2 Pactor3 
AGE 0.700 0.171 

C 0.772 0.216 0.124 

MWD 0.844 0.291 


MER 0.844 0.264 
DELL 0.144 0.536 
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HPQ 

0.294 

0.753 


IBM 

0.258 

0.518 

0.164 

AA 

0.278 

0.575 

0.418 

CAT 

PG 

0.293 

0.334 

0.219 

0.931 


> factor.real=predict(stat.fac,type=^ weighted.Is 4 ) 


最后基于所拟合的二因子统计因子模型可以得到这 io 只股票超额收益率的相 
关矩阵.如所料想.与 9.3.1 节的产业因子模型所得到的相关矩阵相比.此处得到的 
相关矩阵与样本相关矩阵的对应部分更接近.可以用 GMVP 来比较收益率和统汁 
因子模型的协方差矩阵. 

> corr.fit=fitted(stat.fac) 

> print(corr.fit,digita=l # width=2) 

AGE C MWD MER DELL HPQ IBM AA CAT PG 
AGE 1.0 0.6 0.6 0.6 0.19 0.3 0.3 0.3 0.3 0.2 

C 0.6 1.0 0.7 0.7 0.22 0.4 0.3 0.4 0.4 0.3 

MWD 0.6 0.7 1.0 0.8 0.28 0.5 0.4 0.4 0.3 0.3 

MER 0.6 0.7 0.8 1.0 0.26 0.b 0.4 0.4 0.3 0.3 

DELL 0.2 0.2 0.3 0.3 1.00 0.5 0.3 0.3 0.1 0.0 

HPQ 0,3 0.4 0.5 0.4 0.45 1.0 0.5 0.5 0.2 0.1 

IBM 0.3 0.3 0.4 0.3 0.31 0.5 1.0 0.4 0.3 0.1 

AA 0.3 0.4 0.4 0,4 0.33 0.5 0.4 1.0 0.6 0.1 

CAT 0.3 0.4 0.3 0.3 0.11 0.2 0.3 0.6 1.0 0.1 

PG 0.2 0.3 0.3 0.3 0.03 0.1 0.1 0.1 0.1 1.0 


因子 1 



MER MWD C AUfc ： PG HPQ 


0 . 8-1 

0.G ， 

0.4- 

i)7- 

0 . 0 - 


因子 2 



HPQ DELL AA IBM MWD MER 


i.(h 

i).8- 

11.0- 

n.2- 

n . o - 


因了 -3 



CAT AA IBM C AGE HPQ 


m 9-6 对表 ‘2 中〗 0 只股票的月超额收益率拟合 - 个 1 囡子模 M 时的囡子负荷图 
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9.6 渐近主成分分析 

到现在为止.关于 PCA 的讨论都是假定资产的个数小于所考虑时期的个数， 
即 A ： < r . 为了处理： T 较小较大的情形， Conner 和 Korajczyk ( 1986, 1988) 提出 
了渐近主成分分析 ( APCA ) 的 概念. 该方法与传统的 PCA 相似，但是依赖于资产 
数目趋于无穷时的渐近结果.因此 APCA 是基于下述 TxT 矩阵的特征值特 
征向量 分析： 

- 1 k 

Or = 免一 1 y^(R t 一 R){R t - R)\ 
i=l 

其中只，是由（ 9 . 3 )式所定义的第 i 个资产的时间序列 ， 7? 一 (1/ A :) x Y ： ^换言 
之， H 是所用股票的平均收益率 序列. 另外，用 （9.4) 式的符号，我们有^ 

其中 U 是元素全为1的 A : 维向量. Cornier 和 Korajczyk 证明了当趋于无穷时， 
对 Or 的特 征值一 特征向量分析等价于传统的统计因子分析.换言之，闲子/,的 
APCA 估计是的前 m 个特征向最.令九表示由 f ' V 的前 m 个特征向量构成 
的 m x r 矩阵，则/,是 〆 的第 f 列. 利用类似于估计 BARRA 因子模型的思想， 
Conner 和 Korajc Z yk (1988) 建议按如下步骤修正估计九： 

(1) 对 /• = 1，... ， r , 利用样木协方差矩阵得到初始估计 土； 

(2) 对每个资产，给出模型 

r « = a ,+ y 3；/,+ e it , <=1,..., T , 

的 OLS 估计，并计算残差的方差#. 

(3) 构造对角矩阵 X >= diag {( rf ,... 并且将收益率进行如卜刻度变换 

r. = Rtr 1 ’ 2 . 

(4) 利用计算下述 TxT 协方差矩阵 

. 1 

=釦一 1 ( 凡 R* ® — rt^ ® O ’， 

其中 H •是由的行内平均值所构成的 向量. 然后对进行特征值一特征向 
量分析来得到/,的修正估计. 

9 . 6.1 因子个数的选择 

文献中有两种方法来选择因子分析中因子的个数.第一种方法是由 Conner 和 
Korajczyk (1993) 提出的 • 该方法所用的思想是如果 m 是正确的因子个数，则当因 
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子个数从 m 变到 m + 1时资产个性误差^的横截面方差应该不会显著下降.第 
二种方法是 Bai 和 Ng (2002) 提出来的.该方法采用一些信息准则来选择因子个数. 
后一种方法基于这样一个观测到的 事实： 的特征值特征向量分析求解出 f 
下述最小二乘问题 

1 fc T 

u ^ ir i - a » ~ 冰 / t ) 2 . 

假定存在 m 个因子，则/,是 m 维的.令 a ?( m ) 表示对资产 i 进行前面的最小二 
乘问题的组内回归的残差的方差，这里要利用 APCA 分析中得到的九.定义残差 
的横截 曲方差如下： 

斤 2 ( m ) = 

i=l 

Bai 和 Ng (2002) 给出的准则是 

=^ 2 ( m ) + mo - 2 ( M ) 111 ( j ^ Tr ) 1 

C p 2 (m) =a 2 (m) + ma 2 {M) ln ( 尸 fcV) ’ 

其中 M 是事先指定的正整数，它表示因子的最大 个数； P/tr = tnhx ( y / k , VT ). 使得 
C pl ( m ) 或 C p2 ( m ) 最小的 m 便是我们所要选择的因子个数，这里0彡 m 彡 M . 实 
际中，这两个准则可能会选择不同的因子个数. 

9.6.2 例子 

为了进一步说明渐近主成分分析.考虑40只股票的月简单收益率，时间区间 
是从2001年1月到2003年12月，共36个 观测. 于是我们有 A = 40, r = 36•表 
9-6 给出了这些股票的代码.这些股票是在2004年9月份的某一天在 NASDAQ 和 
NYSE 中交易频繁的股票.主要用到的 S - Plus 命令是 mfactor . 

表 9-6 渐近主成分分析中所用到的股票的代码，样本时间区问是从 
2001年1月到2003年12月 

市场 Tick Symbol 


NASDAQ 

INTC 

MSFT 

SUNW 

CSCO 

AMAT 


ORCL 

SIRI 

COCO 

CORV 

SUPG 


YHOO 

JDSU 

QCOM 

CIEN 

DELL 


ERTS 

EBAY 

ADCT 

AAFL 

JNPH 

NYSE 

LU 

PFE 

NT 

BAC 

BSX 


GE 

TXN 

XOM 

FRX 

Q 


F 

TWX 

C 

MOT 

JPM 


TYC 

HPQ 

NOK 

WMT 

AMD 
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我们用前面所讨论的两种方法来选择因子个数. Conner 和 Korajczyk 提出的 
方法选择了 m = 1，而 Bai 和 Ng 提出的方法选择了 m = 6. 对于后一种方法，两 
个准则给出了不同的选择. 

> dim(rtn) % rtn is the return data. 

[1] 36 40 

> nf,ck=mfactor(rtn,ck # # max.k-10 # oig=0.05) 

> nf,ck 
Call ： 

mfactor(x - rtn, k = w ck", max.k = 10, aiy = 0.05) 

Factor Mode1 : 

Factors Variables Periods 
1 40 36 

Factor Loadings : 

Min. 1st Qu. Median Mean 3rd Qu. Max. 

F.l 0.069 0.432 0.629 0.688 1.071 1.612 

Regression R-squared ： 

Mm. 1st Qu. Median Mean 3rd Qu. Max. 

0.090 0.287 0.487 0.456 0.574 0.831 

> nf.bn=mfactor(rtn,k='bn r ,max.k=10,sig=0•05) 

Warning messages : 

Cpl & Cp2 did not yield Bame result.The smaller one is used. 

> nf.bn$k 
【1】 6 

取 m = 6, 我们对收益率序列应用 APCA 可以得到斜坡图和被估收益率因子. 

> apca « mfactor(rtn # k*6) 

> apca 
call ： 

rafactor(x = rtn, k = 6) 

Factor Model ： 

Factors Variables Periods 


6 40 36 

Factor Loadings : 



Min 

1st Qu. 

Median 

Mean 

3rd Qu. 

Max. 

F.1 

0.048 

0.34^ 

O.bbl 

0,643 

0.^b2 

2.222 

F.2 

-1.737 

0.084 

0.216 

0.214 

0.323 

1.046 

F.3 

•1.512 

0.002 

0.076 

0.102 

0.255 

1.093 

F.4 

-0.965 

-0.035 

0.078 

0.048 

0.202 

0.585 

F.5 

-0.722 

- 0.000 

0.056 

0.066 

0.214 

0.729 

F.6 

-0.840 

•0.088 

0.003 

0.003 

0.071 

0.635 

Regression R- 

squared : 





Min 

.1st Qu. Median Mean 

3rd Qu. 

Max. 


0.219 

0.480 

0.695 

0.651 

0.801 

0.999 



> screeplot.mfactor(apca) 

> fplot(factors(apca)) 

图 9 -7 给出了 4() 支股票收益率的 APCA 的斜坡图 . 6 个公共因子大约解释了 
变化的89.4%. m 9-8 给出了 （ i 个被估因子的时间图. 
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图 9*7 


0.44G 



对40只股票的月简单收益率进行 APCA 的斜坡图.样本时间区间是从2001年1 
月到2003年12月 


闪子收益 


0 11) 20 30 



图9 8 对40只股栗的月简单收益率进行 APCA 所得到的因子收益的时间图.样本时间区 
间是从2001年1月到2003年12月 


练习题 

9.1 考虑 Merck ^ Company , . lohnson & Joitnson . General Electric , General Motors , Ford Mo ¬ 
tor Company 股票以及市值加权指数的月对数收益率.收益率以百分比的形式给出并且包 
括分红.时间区间是从1960年1月到1999年12月.数据在文件 m - mrk 2 vw . txt 中，共有 
6列，且排列顺序跟前面列出的一样. 
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( a ) 用样本协方差矩阵对数据进行主成分分析. 

( b ) 用样本相关矩阵对数据进行主成分分析. 

( c ) 对数据进行统计因子分析.识别公共因子的个数，并利用主成分分析方法和最大似然 
方法估计因子负荷. 

9.2 文件 m-excess-cl0sp-9003.txt 中包含 10 只股票和 S&P500 指数的月简单超额收益率. 
利用二级巾场上的 3 个月期闲库券利举来计算超额收益.样本时间区间是从 1990 年 1 月 
到 2003 年 12 月，共 168 个观测.文件中的 11 列分别包 •含 ABT, LLY, MRK, PFE, F. 
GM, DP, CVX, HD, XOM 和 S&P500 指数的起额收益串.利用牟•因子市场模型分析 10 
只股票的超额收益率.对于每只股票，画出其 beta 和 ft 2 的估计.利用全局最小方差组合 
比较所拟合模型的协方差矩阵和数据的样本协方差矩阵. 

9.3 再次考虑文件 m-excess-cl0sp-9003_txt 中 10 只股票的超额收益率股票来自=个产业 
部门. APT . LLY . MRK 和 PFE 是主要的制药公司， F 和 GM 是汽车公司，剩下的为大 
的石油公司.利用 BARRA 产业因子模型分析这些超额收益率.画出三因子实现的图像, 
并说明模型的充分性. 

9.4 再次考虑文件 m - excess - cl 0 sp -9003. txt 中10只股票的超额收益率，对其进行主成分分 
析并画出斜坡图.共有几个公共因子？为什么？解释每个公共因子的含义. 

9.5 再次考虑文件 m - excess - cl 0 sp -9003. txt 中10只股票的超额收益率.对其进行统计因子 
分析，在5%的显著性水平下要用到多少个公共因子？両出所拟合模型的被估因子负荷图. 
这些公共因子有意义吗？ 

9.6 文件 m - fedip . txt 包含从1954年7月到2003年12月的联邦基金有效年利率和月利率以 
及工业生产指数. T ： 业生产指数已经经过 f 季节调整.用联邦基金利率和工业生产指数作 
火宏观经济变 M 力文件 m - excess - cl 0 sp -9003. txt 中11】只股票的超额收益串拟合一个宏 
观经济因子模型.可以用 vaii 槐型來得到宏观经济交量的意外序列.解释所拟合的因了 
樓型. 
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第 10 章多元波动率模型及其应用 


本章将第3章中的一元波动率模型推广到多元情形，并讨论一些方法来简化 
多个资产收益率波动率过程之间的动态关系.多元波动率在金融中有许多重要的应 
用.它们在组合选择与资产分配中非常重要，而且可以用来计算包括多个资产的金 
融头寸的风险值. 

考虑多元收益率序列 （ n }. 我们采取与一元情形相同的方法将序列改写为 


rt = fi t +a t ， 

这里是 r t 在给定过去信息 F t _! 下的条件期望, a , — ( a u ,*» - ,akiY 
是序列在 f 时刻的扰动或新息.假定&过程服从第8章中多元时间序列模型的条 
件期望过程.对大多数收益率序列，对&采用一个带外生变董的简单向量 ARMA 
结构就足够了，即 

p q 

^ 中 , T*t_< - ^ (10.1) 

»=1 1=1 

这里心 表不 m 维外生变量（解释变量）向 M , 其中 ； Ett = 1， T 是 x m 矩阵，且 
p , q 为非负整数.我们称（]0.1)式为 r t 的均值方程. 

在给定下 a t 的条件方差矩阵是一个 kxk 的正定矩阵定义为 

= Cov(a,|J ;1 f _ l ). 

多元波动率的建模关心的是 S , 随时间的演变.我们对指定一个模型称为 
收益率序列 r t 的波动率模型. 

将一元波动率模沏推广到多元情形有许多种方法.但是维数所带來的“祸害” 
很快成为应用中的一个主要阻碍，因为对一个 k 维收益率序列而言， X ,中有 + 
1)/2 个量.为进一步说明，对于一个5维的收益率序列， S , 中有15个条件方差与 
条件协方差.木章主要介绍一些相对简申的多元波动宇模型.它们很有用而且在实 
际应用中容易处理.尤其是，我们讨论了一些允许资产收益率间的相关系数是时变 
的模型.时变相关性在佥融中很有用.例如，它们可以用来估计一个收益率序列市 
场模型的时变系数戸. 

10.1 节首光用指数加权方法來估计协方差矩阵.这样估计的协方差矩阵可以 
作为多兀波动率估 il 的基准 .10.2 节讨沦文献中己有的一元 GARCH 模型的一些 
推广 .10.3 节介绍两种波动率建模中重新参数化 S f 的方法.基于 Cholesky 分解的 
重新参数化是非常有用的 10.4 节以 GARCH 模型为例研究了二元收益率的波动 
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率 模型. 在这个特例中，波动率模型可以是二维或三维的 .10.5 节主要关注史高维 
收益率的波动率模型 . 1 ( ).6节强调了降低维数的问题. 10.7 节说明了多元波动率模 
型的一些应用.最后， 10.8 节给出了对波动率建模有用的多元学生一 < 分布. 

10.1 指数加权估计 

给定新息集合新息的无条件协方差矩阵可由下式估 
计： 

I ^ 

i=i 

这里七的均值理解为 0. 该估计对于和式中的每一项赋予相同的权重 l /( t -1). 为 
了允许协方差有时变性并且强凋对越靠近的新息相关性越大，可以利用指数平滑的 
思想给出协方差矩阵的下述 估计： 

1 一 A t - 1 

l At _, E (10.2) 

其中 0 < A < 1 且权重 （1 - A ) AJ - V (1- A 1 - 1 ) 之和为 1. 对于满足 Y - 1 % 0 的充 
分大的 t ， 前面的估计可以改写为 

Et — (1 — AJat-iaJ.j -f 

因此， （10.2) 式的估计称为协方差矩阵的指数加权滑动平均 ( EWMA ) 估计. 

假定收益率数据为 { n ,-.. , r T }. 给定; \和初始估计 ，则么 可以递归计算 
出来. 若假定 a f = r t - / x t 服从均值为0、协方差矩阵为 S , 的多元正态分布（这 
里/ X ,是参数0的函数).则可以用最大似然方法联合估计出 A 和 ©, 这是因为数 
据的似然函数是 


In L(&, A)oc-i^ ： ln(|E t |)-I JZ(r t - n t )^\r t - ^ t )\ 

t=l i=l 

用红代替可以递归地估算出上式. 

例 10.1 为进一步说明，考虑香港和日本的股票市场指数的日对数收益率.时间 
区间是从1996年1月1日至1997年10月 1 G 曰，共469个观测值.指数以美元度 
量.且收益率以百分比形式给出.选择这个样本段是为了避免亚洲金融危机的影响. 
该危机在1997年10月17日冲击了香港市场.数据来自于数据流 ( Datastream ). 
图 1( M 给出了两个指数收益率的时间图.令 r lt 为香港股票市场的指数收益率， r 2t 
为日本股票市场的指数收益率.如果采用一元 GARCH 模型.则我们得到以下模型 


r\t = 0.090 - 0.0947^-6 + a lt , a it = (T\ t £u, 
= 0.126 + 0.103a^ ( _j + 0.818af t _ lt 


(10.3) 
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( ft ) 香港 


100 200 300 

天 

(I，）曰本 


400 


^2 t = -0.046 + a 2 t , a 2 e = 

崎 = 0.007 4 - 0.054a2. f _t + 0.942<r| t _ 1( 10 ' 4 ) 

其中除了收益率序列的常数项和口本市场收益率的以外的所有参数的估计在 
5 %的水 T 下都是显著的.上述两个一元模型的标准化残差与残差平方序列的 Ljung - 
Bux 统汁量并没有表明模型的任何不充分性.图 10-2 给出了前面两个一元 ( JAH - 
CH (1,1) 模型的波动率估计.香港股票市场看上去比日本股票巾场有更大波动性. 
但是日本市场在后半部分样本屮显示了波动率递增的趋势.香港市场和日本市场 
指数收益率基于模型的渐近标准差分别是 1.259 和 1.393. 数据的样本标准误差分 
别是 I . 2 % 和 1.067. 因此，日本市场指数收益率的一元模型过度估计了无条件波动 
率.这可能是由于（10. 4 )式中 IGARCH 模型的特征引起的，而 IGARCH 模型特征 
的出现又可能是由于所观测到的数据后半部分波动率的跳跃. 


0 100 200 300 400 

天 

图 10-1 香港和日本股票市场指数的 a 对数收益率的时间阁.时间 r 间是从19谢年1月1円 
到1997年 1() 月16日，收益率以百分比形式给出： （ a ) 香港市场： （ b ) 日本市场 

接卜来看二元 模型. 为了简单，我们忽略掉香港市场收益率延迟为6的小的序 
列相关性，并且用 EWMA 方法来得到波动率估计.这要用到 S-Plus FinMetrics 中 
的命令 mgarch : 

> hkja.ewma=mgarch l, formula.var = 〜 ewmal, trace = F) 

Mean Equation ： rtn - l 

Conditional Variance Equation ： - ewmal 
Coefficients : 

C(l) 0.06394 % Expected pcrc. return of Hong Kong market 
C(2) -0.05478 % Expected perc. return of Japanese market 
ALPHA 0.03711 

X 的估计是 1 — 6= 1 -0.037 11 « 0.963. 该值处于实际中常见的范围内.图 
10-3 给出 f 用 EWMA 方法估计出的波动率序列.与图 10-2 相比较， EWMA 方法 
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给出的波动率序列更为平滑,尽管在这两幅图中波动率具有相似的形式. 


(a) 香港 




图10~2 香港和日本股票市场指数日对数收益率的波动率（标准误差）的估计值.时间区间 

是从 1996 年 1 月 1 曰到 1997 年 10 月 16 0,收益率以百分比给出 ： （ a ) 香港市 
场： （ b ) 日本市场.所用的模型是一元模型 


_ _香港 

3「 



0 100 200 300 400 


( b ) 日本 



m 10-3 香港和日本股票市场指数的日对数收益率波动率（标准误差）估计的时间图.时 
间区间是从1996年1月1日到1997年10月 1 G 日，收益率以百分比形式 给出; 
(a) 香港市场： （b) 日本市场.用到了指数加权滑动平均方法 


10.2 多元 GARCH 模型 

很多作者巳经把一元 GARCH 模型推广到多元情形.本彳! •将讨 论这些 推厂中 
的一部分.更多的细节，读者叫以参考最近的综述性文献，如 Bauweiis, Laurent ^ 
Rorabouts(2004). 
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10.2.1 对角 VEC 模型 


Bollcrslev , Engle 和 Wooldridge ( 1 988) 推广了指数加权滑动平均方法并提山了 
下述 模型： m s 

S , = A 0 十 f Ai O ( a t _ ia ；_ j ) ^ Bj © E t _ Jt (10.5) 

其中 rn 和 s 是非负整数， A 和坧是对称矩阵 ,© 表示 Hadamard 乘积，即矩阵的 
相应元素相乘. (10.5) 式称为对角 VEC ( m ，《) 模型或 DVEC ( m , s ) 模型.为了进一 
步理解该模型，考虑满足下述关系式的二元 DVEC (1, 1) 模型 


0*11,t 


^11,0 

0*21,t ^22,t 


乂 21,0 欠 22,0 


^ 11,1 


o 

_ -^ 21.1 

^ 22.1 

Bu,i 

^ 21,1 

只 22,1 

o 




,1 —/02, t — 1 1 

汀 ll.t 1 

戊 22 ,之一 1 


这里只给出了模型的下三角部分.模型可以具体写为 


= ^ ii.o + + ^ n , icrii ,/- t , 

^2i,t = -^2i,n + + B2i,iCT^\ y t-i, 

C22 ， t= A22.0 + ^22,l«2,t-l + ^22.1<T22.t X. 

其中 S t 的元素只依赖于其过去值和 a t _ ia ；_ L 中的乘积项.也就是说， DVEC 模型 
的每个元素都服从 GARCH ( i , 1) 模型，从而该模型很 简单. 然而，它可能产生一个 
非正定的协方差矩阵.进一步地.模型不允许波动率序列之间的动态依赖性. 

例 10.2 为了进一步说明，考虑《个烟草公司的月简单收益率序列（包含分红). 
时间区间是从1965年1月到2003年12月.共有468个观测.令 r lt 表示 Pfizer 股 
票的收益率，表示 Merck 股票的收益率.图 10-4 给出了二元序列= ( r lt , r . 2t )' 
的时间图.图像表明该二元序列没有显著的序列相 关性. 因此， tv 的均值方程只包 
含常数项•在 S - plus 的 FiuMetrics 中，用命令 mgarch 给序列拟合一个 DVEC (1, 1) 
模型. 

> rtn=cbind(pfe # mrk) % Output edited. 

> drug.dvec=mgarch(rtn-1 # -dvec(1,1)) 

> summary(drug.dvec) 

Call ： 

mgarch(formula.mean = rtn - 1, formula.var = - dvec(1 # 1)) 

Mean Equation ： rtn - 1 

Conditional Variance Equation : - dvec(l, 1) 

Conditional Distribution : gaussian 

Estimated Coefficients : 

Value Std.Error t value Pr(>|t|) 
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C(l) 

0.0164424 

3.422e-03 

4.805 

1.047e-06 

C(2) 

0.01509B7 

3.139e-03 

4.810 

1.025e-06 

A(l, 

1) 

0.000S181 

4.348e-04 

1.881 

3.027e-02 

A(2, 

1) 

0.0001021 

4.979e-05 

2.050 

2.048e-02 

M2, 

2) 

0.0001408 

7.067e-05 

1.992 

2.348e-02 

ARCH(1; 1, 

1) 

0.0727734 

2.973e-02 

2.448 

7.363e-03 

ARCH(1; 2, 

l) 

0.0259816 

9.537e-03 

2.724 

3,343e-03 

ARCH(1; 2, 

2) 

0.0518917 

1.753e-02 

2.961 

1.614e-03 

GARCH (1; 1 , 

1) 

0.7777585 

9.525e-02 

0.165 

1.554e-15 

GARCH(1; 2 , 

l) 

0.9407037 

2.191e-02 

42.928 

0.000e+00 

GARCH(1; 2, 

2) 

0.9203388 

2.684e-02 

34.296 

0.000e-f00 


Ljung-Box test for standardized residuals ： 
Statistic P-value Chi A 2-d.f. 
pfe 10.07 0.6096 12 

rark 14.91 0.2461 12 

Ljung-Box test for squared standardized residuals : 
Statistic P value Chid.f. 


pfe 18.30 0.1068 12 
mrk 5.04 0.9566 12 
> names(drug.dvec) 


⑴ 

M residuals" 

■sigma.t M 

"df.residual M 

••coef •• 

【 5] 

"model” 

"cond.dist w 

"likelihood" 

"opt•index" 

t9] 

••cov M 

"std.residuals" 

n R.t n 

n S. t n 

[13] 

"prediction" 

"call" 

"series 1 * 



(n) PFE 收益率 



1970 1980 1990 2000 


年 

m 10-4 PHzer 股票和 Merck 股票月简单.收益率（包含分红）的时间图.时间区间是从 19fi5 
年 1 月到 2003 年 12 月 ： （a) Pfizer 股票； （b) Merck 股票 

从输出结果来看，所有的参数估计在5%的水平下都是显著的，所拟合的波动 
率模型为 

— 0.00082 + 0.073(2^ *+• 0.778cr \\ \, 

0*21 ，/ = 0.00010 + 0.026ax t t— 1 + 0.941(72i,t -1 ， 

(T22,t = 0.0(1014 + 0 .052(3^ 卜 1 十 0.920(722,t— i • 
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年 

图 10*5 为两个主要烟草公司的月简单收益率序列拟合（1， 1) 模型时的被估波动率和被佔 
时变相关系数的时间图.时间区间是从1965年1月到2003年12月： （ a ) PEzer 
股票波 动率； （ b ) Merck 股票波 动率； （ c ) 时变相关系数 

10.2.2 BEKK 模型 

为了保证正定性限制， Engle 和 Kroner (1995) 提出了如下 BEKK 模型： 

m s 

E t = AA ' 4 - E + ^ (10.6) 

*=1 j=l 

其中 4 是下三角矩阵且咸和是 fc x A ： 矩阵.基于模型的对称参数化，若 AA ' 


0.12 
〜 0.10 
0.08 
0.06 


输出结果还给出了一些对单只股票收益率进行模型检验的统计暈.例如， Pfizer 股 
票收益率的标准残差序列和标准残差平方序列的 Tjm, ff -Rov 统计量分别为 Q ( 12 ) = 
1 ( 1 07(0.61) 和 Q(12) = 18.30(0.11), 这里括号内的数字表示 p 值.这样，对两个收益 
率序列逐个检査所拟合的模型1不能拒绝 DVEC(1, 1) 模型.一种包含更多信息的 
模型检验方法是对该二元收益宇序列的标准残差和标准残差平方序列应用多元 Q 
统计量.对于这个特定的 DVEC(1, 1) 模型.我们有 Q 2 (10) = 42.04(0.38),^5(10) = 
67.33(0.004), 其中表示二元标准残差平方序列的 g 统计量.基于二元统计量， 
在5%的显著性水平下均值方程是充分的，然而在1%的水 T 下，拒绝了波动率服 
从 DVEC(1, 1) 模型的假设.图 10-5 给山了所拟合波动率和相关系数序列的时间 
图.这些序列分别名 
0.42 〜 0.84. 


‘ ‘ signal •’和〃中进行了分类.相关系数的变化范围是 


(h) PFE 波动率 
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是正定的，则 s , 几乎处处正定.该模型允许波动率序列之间有动态依赖性.另一 
方面，模型有几个缺点.第一，九和中的参数关于股票或波动率的延迟值没有 
直接的 解释； 第二，参数的个数是 k 2 {m +s) + A:(fc + 1)/2, 它会随 m 和 s 的增大而 
迅速增大.有限的经验表明许多被估参数都是统计不显著的，这使得在建模中存在 
大暈的多余计算. 

例 10.3 为了进一步说明，考虑例 10.2 中 Pfizer 股票和 Merck 股票的月简单收 

益率，并对它们应用 BEKI<(1,1) 模型.再一次用 S-plus 进行估计. 

> drug.bekk=mgarch(rtn- 1, -bekk(1 # 1)) 

> summary(drug.bekk) 

Call ： 

mgarch(formula.mean = rtn - 1, formula.var = - bekk(1 # 1)) 

Mean Equation ； rtn - 1 

Conditional Variance Equation ： - bekk(1 # 1) 

Conditional Distribution ： gaussian 

Estimated Coefficients : 





Value 

Std.Error 

t value 

Pr{>|t|) 


C(l) 

0.0164770 

0.003470 

4.749e+00 

1.369e-06 


C(2) 

0.0142816 

0.003172 

4.503e+00 

4.255e-06 

A(l # 

1) 

0.0245803 

0.008837 

2.702e+OO 

2.815e-03 

A(2 # 

1) 

0.011G134 

0.005953 

1.951et*00 

2.504e-O2 

A(2, 

2) 

0.0002018 

0.267625 

7.541e-04 

4.997e-01 

ARCH(1; 

1 # 

1) 

0.2994052 

0.093304 

3.209e+00 

7,125e-04 

ARCH(1; 

2, 

1) 

0.1952856 

0.075092 

2.601e+00 

4.802e-03 

ARCH(1; 

1. 

2) 

-0.0818745 

0.097810 

-8.371e-01 

2.015e-01 

ARCH(1; 

2 t 

2) 

0.0929540 

0.082626 

1.125e-f00 

1.306e-01 

UAKCH(1; 

1, 

1) 

0.8987043 

0.074407 

1.208e-f01 

0.000e+00 

OARCH(1; 

2, 

1) 

-0.0674587 

0.059595 

-1.132e-^00 

1.291e-01 

GARCH(1; 

1, 

2) 

0.0163848 

0.046402 

3.531e-01 

3.621e-01 

GARCH(1 ; 

2. 

2) 

0.9809547 

0.040158 

2.463e+01 

0.000e+00 


Ljung-Box test for standardized residuals ： 
Statistic P-value Chi A 2-d.f. 
pfe 10.13 0.6044 12 

mrk 15.25 0.2278 12 


Ljung - Box test for squared 81andardized residuals : 

Statistic P-value Chi^2-d.f. 
pfe 18.314 0.1065 12 

mrk 7.174 0.84B9 12 

S - plus 给出的基于单个残差序列的模型检验统汁量不能说明所拟合的 BEKK (1,1) 
模型是不充分的.用二元标准化残差，我们有 Q 2 (10) = 41.57(0.40). Q $(10) = 
65.71(0.006). 类似于 DVEC (1,1) 模型，在1%的显著性水平下 Ljung - Box 统计量 
拒绝了该波动率模型.图 l ( Mi 给出了所拟合的波动率序列和 BEKK (1，1) 模型的时 
变相关系数.与图 10-5 比较，这两个拟合的波动率模型之间确实存在差别.例如， 
BEKK (1，1) 模型的时变相关系数似乎波动更大. 
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图 10*6 为两个主要烟草公司的月简单收益率序列拟合 BEKK (1, 1) 模型时的被估波动率 
(标准差）和被佔时变相关系数的时间图.时间区间是从1965年 i 月到2003年12 
月； （ a ) Pfizer 股票波 动率； （ b ) Merck 股票波 动率； （ c ) 时变相关系数 

BEKK (1,1) 模型的波动率方程为 


^12,« 


0.025 0 


0.025 0.012 

^21,£ ^22,( 


0.012 0.0002 


0 0.0002 


+ 


0.299 

-0.082 


0.195 

0.093 


0.899 

0.016 ' 


- U .067 

0.989 






0.299 

0.195 


-0.082 

0.093 


0.899 -0.067 
0.016 0.989 


^21, t-l <722 .<-l 

其中有 G 个参数的估计在5%的水平下都是不显著的.特别地.常数矩阵 A 仅包含 
一个显著的参数.进一步，我们需要进行矩阵的乘积来解释所拟合的模型. 


10.3 重新参数化 

给多元波动率建模时有用的一步就是利用 s t 的对称性将其重新参数化.我们 
考虑^的两种葷新参数化方法. 

10.3.1 相关系数的应用 

对&的第一种重新参数化方法是利用的条件相关系数和方差.具体地.我 


(a) PFE 股票波动率 




2109876 
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们将 S , 写为 

S e = K.tl = D tPt D t , (10.7) 

其中 P , 是 tt , 的条件相关矩阵， D ，是 A ： x A 对角矩阵.其元 素为叫 各分量的条件 
标准差[即= diHg { v / o 7 n 7, ••- , v / oTm }]- 

因为巧是具有单位对角元的对称阵，所以 S t 随时间演变是由条件方差 
与 P , 的元素控制的，其中 j t i d d 因此，对 a < 的波动率建模.只要 
考虑叫的条件力差和相关系数就足够了.定义 MA :+ l )/2 维向量 

s, = (<T Ut t, - , <T fcfct t, g [)\ (10.8) 

其中 A 是对相关矩阵 P , 进行列拉直得到的 it ( A : - 1)/2 维向量.但是只利用了主 
对角下面的元素.具体写出来，对一个 fc 维收益率序列， 

Qt = … TPu.tlp32.er** ， /^2,*| • • • Ipfc./t-i.t)' 

为进一步说明，对于 A : = 2,我们有込=/^，纟且 

— (crii ， jt,cr22 ， t ， /?2i ， f )’， （ 10.9) 

它是一个3维的向量.对 fc = 3. 我们有 e , = 0> 3 M , p 3 M ， Aw , t y 且 

St = (<T 1 i f t , < T 22, t . ^33 ,tt P 2 \,ti P 3 l , t , P 32, lY , (10.10) 

它是一个 6 维的随机向量. 

如果 a , 是二元正态随机变量.则三 f 由 (10.9) 式给出，而且 a , 在给定 F ( _! 
下的条件密度函数为 


/( ai f , a 2t | E f ) =- - —- exp 


2n^Ja lu a 2 2A^ ~ pl ut ) 

其中 Q(a ltl a 2t ,S t ) = _^L + _^L_ 2 阳， 

a ll,t ^ 22 ,< 

与最大似然估计有关的的对数概率密度函数为 


Q(au,a2t,S() 
2(1 P 2 2i,t) 


fin.it, n-2 t ,S t ) = — ~ 心 n[n" U ， t r7 2 2，，（l 




4 


2p2M a l*°2i > 


Vll.t °"22，t y^ll ， t 汀 22,t, 

( 10 . 11 ) 


这个重新参数化是很舍用的，因为它直接对协方差和相关阵建模.然而此方法也有 
几个缺点.第一，当> 3时.似然函数变得非常复杂.第二，此方法在估计中要求 
带限制的最大化以保证 S t 的正定性.当 it 很大时，这个限制将变得很复杂. 






10.3.2 Cholesky 分解 
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S t 的第二个重新参数化是利用 Cholesky 分解.参见第8章的附录 A . 这个方 
法在佔计屮有很多优点，因为它不会为得到&的正定性加任何的参数限制.参见 
Poiirahmaxii (1999). 另外，这种重新参数化方法是一个止交变换.所以似然凼数极 
其简单.下面给出变换的细节. 

因为 S , 是正定的，所以存在一个具有单位对角元素的下三角矩阵和具有 
正对角元素的对角矩阵 G t ， 满足 



= L , G t L ' t . 


( 10 . 12 ) 


这就是著名的 S , 的 Cholesky 分解.该分解的一个特征是 L , 对角线以下的元素与 
G , 的对角元素都有良好的解释.我们通过仔细研究二元和三元的情形来说明这个 
分解.对二元情形.我们有 


Sf = 

<^21,t 

<^21,t 

a 22,t 

， u 

Y == 

1 0 " 
_ 921,( 1 

, Gt = 

5ll.< 

0 

其中对 _/ = 1 和 2 .有 ai，,t > 

0. 利用 (10.12) 式 , 我们有 



= 

^ll.t 

^12, < 

卩 12,/ 

(^22,1 

= 

.9n,t 

_ 721,(.711, < 

Q2i,t9n,t 

522 ,f + <721.t»U,/ 


0 
i /22 ,t 


令上述矩阵方程两边的元素相等.我们得到 



^21 t f = 

= <Z21.t.9ll,t, ^22, t — 

922.1 + ( llx . tdn . t - 

(10.13) 

解这个方程，我们有 






511.^ 一 


tl 21 ,t - 

^21,1 

= 922.1 

^n,t 

_ ^21,1 
^22,e • 

(10.14) 

然而.考虑简单的线性回归 







«2t 

fto-u -\- b 2t , 


(10.15) 


其中表示误 差项. 由著名的最小二乘理论，我们有 

_ Cov ( g u ,« 2t ) 二 <721,> 
Var ( a u ) _ a u , t ' 


Var (6 2 t ) = Var ( a 2 t ) - /? 2 Var ( a lt ) = < r 2 2,t - 
进一步，误差项与回归项 a lf 是不相关的.因此，利用 （10.14) 式.我们有 


9u,t = ar u ,t, <72i.t = fl, <； 22.t = Var( 6 2i )， 丄 a u , 



396 第 10 章多元波动率模型及其应用 


其中丄表示不相关.总之，2 x 2矩阵 S , 的 Cholesky 分解相当于 从叫到 b , = 
—)' 进行的一个正交变换,满足 

6it = 和 6 鉍 = agt — 92i f <ttK, 

其中 < 72M =沒是通过 （10.15) 式的线性回归得到的， Cov ( fe t ) 是对角元素为的 
对角阵.变换的量 办 u 与 9v.,t 可以作如下 解释： 

(1) G t 的第一个对角元素恰是 a lt 的方差. 

(2) G t 的第二个对角元素是 （10.15) 式简单线性回归中残差的方差. 

(3) 下三角矩阵 A 的元素 < 721 , t 是 (10.15) 式中的回归系数/3. 

对髙维情形，以上性质仍然成立.例如.考虑三维情形 



1 0 0 


9iht 0 0 

Lt = 

(721,e 1 0 

,G* = 

0 922,t 0 


931, e ^32,t 1 


0 0 P33,i 


由 (10.12) 式中的分解.我们有 


^n,t 


疔 31.t 


^2l,t 

^22,t 

^ ： i2t 


^31,t 

<^32,t 

^33 t 


<Jn,t 

9n,t9n,t 

Qsi,t9n, 


fi2l,t922,l Q2l,t9n,t + 922,1 931,t921,t.9u,t + qz2,t922,t 

Q ： n.t9ll,t 931.t921,tPll,t 4 - (l32,ty22,t + Q32,t922,t + {/33，t 

令上述矩阵方程两边的元素相等，我们有 


CTll.t — yiu- ^2l,t = Q2l,tSn,ti ^22.t = + fl22.C, O^l.t = 


江 32,t = (l3l,tQ2l,tgn,t +- Q32,t922,t, ^33,t = + %2,t922,t + 533,4, 

或等价地， 

戊 21 ,t 2 

Q 7 \,l = - . 999.1 = <7^2 ,t — ( hl , tQ ^ t ' 

^11,1 

^31 i 1 ( ^31, t ^21 ,A 

Q：nj — - ， fl32,f — - I (^32,1 - J ， 

(T\U (J224 \ ^\u ， J 

.933,< = ^33,t - Q31.t9U,t - 932,f.922,t- 

这些量看起来很复杂，但是它们只不过是下述 if 交变换的系数和残差的方差 


bu = ( iu , b 2 ( = «2<. — j 32 ibu , b-M — a^t — Pz \ b\t — /?32&2<， 





其中是下述最小二乘回归的系数. 
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a 2 t — ( hl^xt + ^21 ■> = p 3 \bu -f /?32^2 t + f )3 t - 


换句话说，我们有 = /? ij , = Var (& it ) 且对 i 羊 j . 有 b it 丄 b jt . 

根据前面的 i 寸论.利用 Cholesky 分解相当于作一个从 a t 到 b , 的正交变换，其 
中 6 lt = a u ， 且 6 it (l < i $幻是通过最小二乘回归递推定 义的： 


a it — 4- qi2,t^2t + …+ l)t • ^iU (10.16) 

其中对于1 O < i , 阳.< 是下三角矩阵及的第 Oi , j ) 个元素. 

我们可以将这个变换写为 

b , = L ^ a t , 或者 = L t b t , (10.17) 

其中，如前所述， ir 1 也是一个具有单位对角元素的下三角阵 . 仏的协方差矩阵是 
Cholesky 分解中的对角阵 G t , 因为 

Cov(b t ) = iriwV = <7 卜 

在这样一个变换下，与波动率建模相关的参数向量变为 

三= (,9n.t, - • - 1 ^fcfc.t. 92i,t- 93i, Q32.t,' - - ， (Jki.t, •.. ，办 (/t—”,*)’， (10.18) 

它也是一个 k ( k + l )/2 维的向量. 

前面的正交变换也大大简化了数据的似然函数.利用 | L t | = 1的事实.我们有 

k 

|S e | = I^G^I = |G,| = n(10.19) 

i=l 

如果在给定过去信息的条件下％的条件分布是多元正态分布 iV (0. S t )， 则变换后 
的序列~的条件分布是多元正态分布 N ( G ， G ,)， 且数据的对数似然函数变得极其 
简单.事实上，我们有的对数概率密度为 


1 k 

e(a t ^ t ) = e(b t ,E.,)^-^ 




(1(J.2U) 


这里为/简便，忽略了常数项，且糾, t 为 h 的方差. 

利用 Cholesky 分解.将重新参数化有几个优点.第一，由 （10.19) 式，如果 
对所有的 i , 有乐 M > U , 则是正定的.因此， S , 的正定限制可以通过对 ln (. y „, t ) 
而不是如 . t 建模很容易地 得到. 第二， (10.18) 式中参数向量 S , 的元素有良好的解 
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释.它们是使得扰动与收益率正交化的多元线性回归的系数与残差的方差.第三, 
ttu 与间的相关系数为 


P2i,t = 




= <l2\ y t X 


\/^ T 7 

v / 汀 22 .t 


若 <72 i，f # 0 ,则 p2i,f 是时变的.特别地，如果 92 U = c / 0, 则/ > 2i,t = Cy / auj/yjam 
假定方差比 au . t / cT 22, t . 不是常数.则它仍然是时变的.若^的维数大于2,时变性 
也适用于其他相关系数，并且时变性是将 S , 重新参数化的两种方法间的主要区别. 
利用 (10.16) 式及变换后的扰动 /; it 之间的正交性、我们有 


= Var ( ai / 1/^_1 ) = 、 '• Hjy.tQvv.ti * = 1，... ，左， 

V=1 


i 

^ij.t = Cov{(lu ， (ljtlFt — l) — (]iv,tQjv,t9w,ti j < i ，* = 2, • • • ， / c, 

W =1 

其中对 y = l ,---, A ;., = 这些方程给出 / & 在 Cholesky 分解卜的参数化. 


10.4 二元收益率的 GARCH 模型 


因为叫以用同样的方法将许多一兀波动率模型推广到多兀情形，所以我们的讨 
论集中于多元 GARCH 模型.也可以用其他的多元波动率模型. 

对一个 A: 维收益率序列多元 GARCH 模型利用“精确方程”来描述 k(k + 
1)/2 维向量 S , 随时间的演变.精确方程的意思是这个方程不包含任何的随机扰动. 
然而，精确方程即使是在最简单的情形= 2时也可能变得很复杂，此时三,是三 
维的.为了保持模型的简单性.通常对方程加一些限制. 


10.4.1 常相关模型 

为，使波动率方程的个数较少 . Bollerslev (1990) 考虑了相关系数非时变的特 
殊情形，即= p 21 , 其中|^ 21 | < 1 . 在此假定下 . p 21 是一个常参数.从而对 
H ； = {< r u , t ,( T 22, ty 而言，波动率模型包含两个参数 . S ; 的 GARCH ( l . l ) 模型变为 


S； 1 = Ot 0 十 


( 10 . 21 ) 


其中 a ? ，= ( d \ y , t . aU ^ oto 是一个二维 TF . 向暈.目 . at ! 和士是2 x 2非负正 
定矩阵.更具体地.此模型可以更详细地表示为 


<^U,t 


«10 

+ 

a u 

«12 

(^22,1 


^20 


a2i 

«22 


a 2.t- 1 


011 0\2 
021 ^22 


^ 22,£-1 


( 10 . 22 ) 
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其中对 i = 1和2, 有叫 0 > 0.定义仏 = a ? - Sr ， 我们可将前面的模型改写为 

°? = «o + («i 4 - P\)al_ x -\-Vt~ PiVt-i ， 

这是关于 a ? 过程的一个二元 ARMA (1,1) 模型.这个结果是第3章中一元 
GARCH (1,1) 模型的直接推广_因此，模型 (10.22) 的一些性质可以从笫8章中 
的二元 ARMA (1,1) 模型的性质中很容易地得到.特别地，我们有如下结果. 

(1) 如果所有的特征值都是正的，并小 P 1,则 < 的二元 ARMA (1,1) 
模型是弱平稳的，从而 E ( a ' f ) 存在. 这意味着收益率的扰动过程 a , 有正定的无条 
件协方差矩阵 • 各分量的无条件方差是 ( ala? 2 y = (!-«!- /^广 1 %,且分量 
ait 与 a 2 t 间的无条件协方差是 p 2\(^\(^2- 

(2) 如果 a 12 =汍 2 = 0,则 a lt 的波动率不依赖于过去的波动率.类似地, 
如果 《21 == 0,则 a 2 t 的波动率不依赖于 au 过去的波动率， 

(3) 如果 ai 和&是对角的，则此模型简化为两个一元 GARCH ( l . l ) 模型.此 
时，这两个波动率过程不再是动态相关的. 

(4) 可以利用向量 ARMA ( U ) 模型的预测方法类似地得到该模型的波动率预 
测.参见第3章中的一元情形.以 h 为预测原点的向前1步波动率预测为 

S/U 1 ) = «() + ataf + 

对向前〖步预测 1 我们有 

S ； l (0 = a 0 + ( a l +/3 1 ) S ；(£- l ), i >\. 

这些预测是对 a lt 的边际波动率的预测 . 与《 2 ,之间的向削 （ 步协方差预测为 
如[叫,/» W 22./ V ⑷严，其中 M 是内 I 的估计， a “崩是 S ；(0 的分童. 

例10. 4 再次考虑例 10.1 中的香港市场和 tl 本市场的日对数收益率.利用二元 
GARCH 模型，我们得到了对数据拟合较好的两个模型.第一个二元模型的均值方 
程为 

r lt = — 0-118 ri t t _6 + flit , T2t = « 2 < - 
其中 AR (6) 系数的标准误差为 0.014. 第一个模型的波动率方程为 

0.275 ] 「 0.112 . 1 「 0.711 . 

^n,t] (0.079) (0.032) (0.068) 

<722, tj 0.051 . 0.091 . 0.869 

(0.014)J [ (0.026)J [ (0.028) 

(10.23) 

其中小括号内的数值为标准误差 . du 与 《 2 , 之间的相关系数的估计为 0.22 G . 标准 
误差为 0.047. 
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令= ( aw ,« 2t ) / 是标准化残差，其中 b = a it /^/ a tl , t - 屯的 Ljung - Box 统计 
暈为 Q ' i (4) = 22.29(0.10), 02(8) = 34.83(0.29). 括号内的数表示 p 值.因为均值方 
程中利用了 AR (6) 系数，所以这里的 p 值分别基于自由度为15和31的 x ： 2 分布, 
df 过程的 Ljung-Box 统计量为 Q $(4) = 9.54(0.85), Q ;(8) = 18.58(0.96). 因此，在 
模型 (10.23) 的二元标准化残差中没有序列相关性或 S 件异方差性.香港市场和曰 
本市场的两个残差的无条件新息方差分别是 1.55 和 K 28. 

(10.23) 式的模型给出了两个分离的波动率方程，这表明两个市场的波动半不 
是动态相关的，但它们是同步相关的.我们将这种模型称为二元对角常相关模型. 
如果忽略掉香港市场收益率中很小的延迟为 6 的序列相关性，则用 S-plus 可以很 
容易地估计常相关 模型： 

> hkja.ccc=mg 2 Lrch (r-h 1, ccc(l,l) ， trace=F) 

>summaxy (hkja.ccc) 

第二个二 7 t GARCH 模型的均值方程为 

ru = -0.143 ri (l _ 6 + a it , r 2f = a 2 «, 


其中 AR (6) 系数的标准误差为 0.042. 第二个模型的波动率方程为 





' 0.108 • 


• 0.865 ' 


「 - 


0.378 




r - 







(0 UYA) 

+ 

(0.030) 


4 ，，一 1 

+ 

(0.109) 


cr\\ y t^\ 

<^22 人 




0.172 


上 L I. 


0.321 0.869 


汀 22，《-1 


- - 


(0.035) 


(0.135) (0.028) 



(10.24) 

小括号内的数值是标准误差 . 与 a 2< 之间的相关系数的估计为 0.236, 标准误 
差为 0.045. 如前一样定义标准化的残差，我们得到对于第二个模型的标准化残 
差 Q 2 (4) = 24.22(0.06), Q 2 (8) = 35.52(0.26); 对于标准化残差的平方 Q ^( i ) - 
17.45(0.29). Q^(8) = 24.55(0.79). 这些 Ljung Box 统计量在 5% 水平下都是不显 
著的.从而 （ 10.24) 式中的模型也是充分的.第二个模型中香港和日本市场新息的 
无条件方差分别为 1.71 和 1.32. 

与模型 (10.23) 比较，第二个二元 GARCH(1,1) 模型显不了两个市场之间的一 
种反馈关系.从而比较这两个模型是很有趣的.第一，模型 (10.24) 的新息的无条件 
方差接近于 (10.3) 式和 (10.4) 式的结果.第二，图 1CK7 给出了模型 (10.23) 所拟合 
的波动率过程.而图 10-8 给出了模型 (10.24) 所拟合的过程.因为模型 （ 10.23) 意 
味着两个市场之间的波动率没有动态依赖性，所以图 10*7 类似于图 10^2. 相反地, 
m 10-8 却给出了两个市场之间相互影响的证据.第三，模型 （ 10.23) 的对数似然函 
数最大值为 -535.13, 其中 f ,409, 而模型 (10.24) 的对数似然函数最大值是 

-540.32. 参见 (10.11) 式中的对数概率密度函数.因此.如果用似然原理.则更喜欢 
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用模型 (10.23). 最后，因为两个二元波动率模型的实际含义有较大不同，为了区分 
它们需要做进一步的研究.这样的研究可能要使用一个更长的样本时期或包含更多 
的变最（例如使用一些 U . S . 市场的收益率). 


图 10-7 


图 10-8 




天 


香港和曰本股票市场指数曰对数收益率的波动率的估计倌.时间区间是从年 
1月1日到1997年10月16曰，收益率以百分比给出的： （ a ) 香港 市场； （ b ) 日本 
市场.所用模型为 （10.23) 式 




( a ) 香港 



5 

4 

脊3 

^ 2 
^ 1 


( b ) H 本 



400 


天 

香港和日本股票市场指数日对数收益率的波动率的估计值.时间区间是从1996年 
1月1日到1997年10月16日.收益率以百分比给出的= ( a ) 香港市场： （ b ) 曰本 
市场.所用模型为 （10.24) 式 


例10. 5 作为第二个解释，考虑笫8章使用的 IBM 股票和 S & P 5 UU 指数月对数 
收益. 时间区间是从1926年1月至1999年〖2月，且收益率以百分比形式给出.令 
r ], 和 r 2< 分别表示 IBM 股票和 S & P 500 指数的月对数收益.如果利用一个常相关 
的 GARCH (1,1) 模型，则我们得到的均值方程为 


r \t = 1-351 + 0.072t"i, 卜 1 + 0_055r!,t_2 — 0.119r2.t — 2 + a u, f2t = 0.703 + U2t, 
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第一个方程中参数的标准误差分别为0.225, 0.029, 0.034 和0.044,第二个方程中参 
数的标准误差为 0.155. 波动率方程是 

' 2.98 1「 0.079 • 1 「 0.873 -0.031' 

cth .,1 _ (0.59) (0.013) (0.02(3) (0.009) pri U - i _ 

< t 22 ,t 2.09 0.042 0.045 -0.066 0.913 [< T 2 2 , e-i 

(0.47 )J [(0.009) (0.010)J [(0.015) (0.014) 

(10.25) 

小括号内的数值为标准误差常相关系数是 0. G 14, 标准误差为 0.020. 利用标准化 
残差，我们得到 Ljung-Box 统计量 Q 2 (4) = 16.77(0.21), Q 2 (8) = 32.40(0.30), 括号内 
的 P 值是分别从自由度为13和29的 X 2 分布得到的.这里的自由度已经调整了，因 
为均值方程包含三个延迟预测.对标准化残差的平方，我们有必⑷=18.00(0.16)， 
Q - 2 (8) = 39.09(0.10). 因此，在5%的显著水平下，标准化的残差心没有序列相关性 
或条件异方差性.该二元 GARCH ( M ) 模型表明这两个月对数收益的波动率之间 
具有反馈关系. 

10.4.2 时变相关模型 

常相关系数波动率模型的一个主要缺 点是： 在实际应用中，相关系数有随时间 
变化的趋势.考虑例 10.5 中使用的 IBM 股票和 S & P 500 指数的月对数收益率.我 
们很难有理由认为加权平均的 S & P 500 指数收益率与在过去70多年的 IBM 收益 
率保持一个常相关系数.图 10-9 利用120个（即10年）观测值的一个滑动窗口，给 
出了两个月对数收益率序列之间的样本相关系数.这个相关性随时间变化.且看上 
去近年来正在递减.相关性的递减趋势并不奇怪.因为 IBM 市场资本化在较大的 
美国工业公司中的棑名近年来已经改变 .Tse (2000) 提出了一个拉格朗日乘子统计 
景来检验多元 GARCH 模窀中常相关系数的假定. 



19&0 1900 1970 1980 1990 2000 


年 

^ 10-9 IBM 股票与 S & P 500 指数的月对数收益率的样本相关系数.这个相关系数是由120个 
观察值的滑动窗口计算出来的.样木时间区间是 192 G 年1月至1999年12月 
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在 GARCH 框架内放松常相关限制的一个简单方法是对条件相关系数指定一 
个精确方稈.这可以利用节讨论的 E , 的两种重新参数化方法,进而通过两种 
方法来进行.首先，我们直接利用相关系数.因为 IBM 股票和 S & P 500 指数收益率 
间的相关系数为正，而且一定在区间[0.1】中，所以我们用方程 


P2\,t = 


exp ( r / f ) 

1 + exp ( fy ,) 


(10.26) 


其屮 

g* = 十 -j- zj ，. ai ，“ l</2 ’’ 1 

是扰动化―,的条件方差.我们将此方稈称为相关系数的一个 GARCH ( Ll ) 
模型，这是因为它利用了两个扰动的1步延迟交叉相关系数与1步延迟交叉乘积. 
如果 zi；i = ca 2 = 0. 则模型 （10.26) 退化为常相关的情形. 

总之.时变相关的一•元 GARCH (1，1) 模型包含了两套方程.第一套方程包含了 
条件方差的一个二元 GARCH ( l t l ) 模型. 第二套方程是 (10.2 G ) 式中相关系数的一 
个 GARCH (1，1) 模型. 丈际中，如果相关系数为负，则可以在 (10.26) 式中添加一 

个 负号. 一般来讲.当相； X ；性的符号未知时，我们可以利用相关系数的费希尔变换 
(Fisher IVaiisformation ). 


<li = In 


( 1 +/^2t,A 

\ 1 — P2l,t J 


或 P21,l = 


exp ( g <) - 1 
exp (屮 ）+ 1’ 


并对少采用一个 GARCH 模型来对两个收益率之间的时变相关系数建模. 

例10. 5 (续）对 IBM 股票和 S & P 500 指数的月对数收益率我们建立了 （10.25) 式 
的 GARCH ( U ) 模型.将 (10.26) 式增加到其中，并进行联合估计，则对两个序列我 
们得到下面的 模型： 


『if 二 + (J.07Cri t f_i — 0 . 068 r 2 ,f— 2 + flu , 

T2t = 0.673 + «2t- 


第一个方程中三个参数的标准误差分别为 f) 215, 0.0 2 6 和 0.034, 第二个方程中参 
数的标准误差为 0.151. 波动率方程为 



• 2.8() _ 


• 0.084 

• 


0.864 

-0.020" 

^n,t 


(0.58) 

+ 

(0.013) 



a lt-i 


(0.021) 

(0.009) 



1.71 


0.037 

0.054 


. a h i _ 

卞 

-0.058 

0.914 


(0.40) 


(0.0U9) 

(0.010) 


(0.014) 

(0.013) 


如前.小括号内的数值为标准 误差. 条件相关系数方程为 


y 

°"22, t-l 

(10.27) 


1 + exp ( g t ) 


qt = 2.024 + 3.983 灼 -1 + 0.088- , 


(10.28) 
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估计的标准误差分别为 0.050, 0.090 和 0.019. 上述相关系数方程的参数是高度显 
著的.对标准化残差 a t 应用 Ljung - Rox 统计量，有 Q “4) = 20.57(0.11)， Q 2 (8) = 
36.08(0.21). 对残差序列的平方，有 Q $(4) = 16 69(0.27), Q $(8) = 36.71(0.19). 因此， 
模型的标准化残差没有显著的序列相关性或条件异方差性 

将这个时变相关系数的 GARCH(1,1) 模型与 （ 10. 25 ) 式中的常相关系数的 
GARCII(l.l) 模型进行比较很有趣.第一，两个模型的均值方程和波动率方程都接 
近.第二，图 10-10 给出了基于模型 （ 10. 2 8) 对 IBM 股票和 S&P500 指数的月对数收 
益率所拟合的条件相关系数的时间图.此图表明该相关系数随时间波动，而且近几 
年变得更小. / S —个特征与图 1()-9 的结论 •致. 笫二，对相关系数拟合的平均值为 
0.«12, 这与 (10.25) 式中常相关模型的估计 0.614 基本相同.第四，利用 nt 的样本方 
差作为条件方差的初始值.观测值从 （ = 4 到 t = 888 .则对常相关 GARCH(1,1) 模 
型， 其对数似然凼数的最大值为 -3 691.21; 对时变相关 GARCH(1,1) 模型，其对数 
似然函数的最大值为 -3 679.64. 这表明，与常相关模型相比时变相关模型的确有一 
些显著的改善.第五.考虑两个模型以 /I = 888为预测原点的向前1步波动率预测. 
对 (10.25) 式的常相关模型，我们有 哪 = 3.075, a 2t88 8 = 4.931, a„. 88 « = 77.91. 
^22,888 = 21.19. 因此.对条件协方差矩阵的向前 1 步预测为 

+ [ 71.09 21.83 

Ss88( )= L 21.83 17.79 1 

其中协方差是通过常相关系数 0.614 得 到的. 对于 (10.27) 式和 （10.28) 式的时变 


相关模型，我们有 a 1)888 = 3.287, a 2>888 = 4.950, a n , 888 = 83.35, « r 22(888 = 28.56, 
ma = 0.546. 协方差矩阵的向前 1 步预测为 


S 娜 ⑴= 


75.15 23.48 
23.48 24.70 


其中相关系数的预测为 0.545. 



1940 I960 198U 2000 


年 

围 10-10 为 IBM 股票与 S & P 500 指数月对数收益率的条件相关系数拟合例 10.5 中时变朴1 
关系数 GAHCH ( U ) 模型时的时间图.水平线是相关系数的平均值 0.612 
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在第二个方法中.我们利 用&的 Choksky 分解来对时变相关件建模.对二元 
情形，参数向量为 S , = 0 / 1U ， 伽, 1 伽,参见 ( 10 . 18 ) 式假定服从下述简单 
GARCH ( U ) 类模型 

<7i j ,«= am + + 沒 liflii.t-i ， 

= 7 o 十1 十72叱,卜1， (10.29) 

.922.< = «20 + a 21 ^ l , f-l 4- «22^2. t-I + + ^22</22.<-1； 

其中 ， h = an h =吻一 q 2 ua lt . 这样，假定 6 lt 为一个一兀 GARGH ( l . l ) 模型， 
b 2 t 使用一个二元 GARCH (1,1) 模型，物, t 是自相关的，并将 a 2 , t - i 作为一个额外 
的解释变量.与 MLE 相关的概率密度函数由 （10.20) 式给出，取 fc = 2. 

例 10.5( 续）我们再次使用 IBM 股票和 S & P 500 指数的月对数收益率来说 
明 (10.29) 式的波动率 模型. 利用与前面同样的指定，我们得到拟合的均值方程 
为 

r\t = 1.364 + 0.075ru_i — 0.058 厂 2, 卜 2 + r 2 « = 0.643 + «2f. 

其中，第一个方程中参数的标准误差分别为 0.219. 0.027 和 0.032, 第二个方程中参 
数的标准误差为 0.154. 这两个均值方程都接近于以前得到的结果.拟合的波动率 
模型为 


<7ii,< = 3.714 + 0.1136j t-1 -(-0.804^ii,t-i» 

gai.i = 0.002 9 + 0.991 5<72i.#-i - 0.004 la,.,-!, (10.30) 

922,t = 1.023 十 （ ).02161.^ + 0.0526!. t _i — 0.040"ii ， t-i + 0.937^22,1-1> 


其中吣 = a u , h = 吻 - q ； lit b u . 方程中参数的标准误差分别为 1.033. 0.022 
和 0.037. 方程 y 2 i , t 中参数的标准误差分别为 0.001. 0.002 和 0.000 4,方程 g 22 ,t 
中参数的标准误差分别为 0-344, 0.007, 0.013 和 0.015. 所有的估 i | 都在〖％水平下 
显著. 


条件协方差矩阵&可以利用 (10.12) 式屮的 Cholesky 分解从模型 （10.30) 屮 
得到.对二维情形，这个关系在 (10.13) 式中已经详细给出.因此，我们得到时变相 


关系数为 


\Z fr U,t< T 22,f. 


’卿 〆 十 <l2l 31U 


(10.31) 


利用 < r u , t 和巧 2 ,,的拟合值，我们可以计算标准化残差来进行模型检验.模型 
(10.30) 的标准化残差的 Ljuag-Box 统计量为 Q 2 ⑷= 19.77(1).14)， Q 2 (8) = 34.22(0.27). 
对标准化残差的平方，我们有⑷= 15.34(0.36)， Q 5(8) = 31.87(0.37). 这样，所拟 
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合的模型在描述条件均值和波动率方面是充分的.这个模型反映了该相关性有很 
强的动态依赖.这可从 (10.30) 式的系数 0.991 5看出 • 

图 10-11 给出了 (10.31) 式拟合的时变相关系数.它给出了比图 10-1() 更光滑 
的相关模式.并确认了相关系数的递减趋势特别地，所拟合的最近几年的相关系 
数要小于其他模型的拟合值•对 IBM 股票和 S&P500 指数的月对数收益率的两个 
时变相关模型具有扣当的最大似然函数值.大约为- 3 G 7 2 . 这表明拟合是相似的 
然而，基于 Cholesky 分解的方法可能有一些优点.首先，它并不要求为了保证仏 
的正定性而在估汁中做任何参数 限制. 如果也利用了仏 u 的对数变换 • 则对整个的 
波动率模型都不需要限制.其次.在变换下，对数似然函数变得很简单.最后.时变 
参数和仿 M 有良好的解释.然而，该变换使得推断有点复杂，因为拟合的模型 
可能依赖于％屮元素的次序.请记住， a lt 没有变换.理论上，叫中元素的次序应 
该小会对 波动丰 产生影响. 



阁 10-11 用带 Cholesky 分解的时变相关系数 GARCH ( l . l ) 模型拟合的 IBM 股票与 
S & P 500 指数的月对数收益串的条件相关系数.水平线是相关系数的平均值 
0.612 


最后，对于新的时变相关模型.以〖_ 888为预测原点，条件协方差矩阵的向前 


1步预测 




73.45 7.34 

7.34 17.87 


由此得到的相关系数的预测为 0.203. 该值远远小于前两个模型给出的结果.然而， 
条件方差的预测与前面类似. 


10.4.3 最近的一些发展 

对于 p t ，利用 （10.7) 式中的参数化，有些作者提议利用参数个数更为节约的模 
型来描述时变的相关系数. F 面讨论在该方面的两个发展. 
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对于 / r 维收益率, Tse 和 Tsui (2002) 假定条件相关矩阵服从模型 
Pt = (1 - ^1 — 0 2 )p + 0\Pt-i 4- 没2^-1， 

其中化和^是尺度参数， p 是具有单位对角元素的 k x k 正定矩阵.且,是 
kxk 样本相关矩阵.它是利用时间点 t - in , - • • . 1上的扰动计算的.其中 m 是 
事先指定的.要求对两个尺度参 数^和 6/ 2 的估计作特殊的限制以保证相关矩阵 
的正 定性. 这是一个参数非常节约的 模型. 然而该模型在实际中很难应用， p 和 m 
的选择需要进行仔细的研究. 

Engle (20 U 2) 提出了如下 模型： 

Pt = 

其中， Q , = { Qij , t)kxk 是正定矩阵， •/, = diag{d …，‘ 1 f 2 }， 且 Q t 满足 

Q, = (1 - 6>! - 0 2 )Q + + 0 2 Q t _i ， 

上式中 e , 是标准化的新息向量.其第 i 个分量为〜 = 且 Q 是的无 
条件协方差矩阵 ，^和 心是满足0 < (9, \ 0 2 <1 的非负刻度参数 • J , 是用来标准 
化的矩阵以保证只，是相关矩阵 • 

上述两个模型有一个明显的缺陷，即 ^和^ 是刻度.因此所有的条件相关系 
数具有相同的动态性.在实际应用中，很难去判断这是否合理，尤其是当维数 A •较 
大时. 


10.5 更高维的波动率模型 

ll : 本节中，利用 Cholesky 分解的序贯性，我们提出一个构造更高维波动率模型 
的 策略. 再次将向量收益序列写为 r , = 仏 + a ( . 可以利用第 8 章的方法为 r< 指定 

一个均值方程.通常简单的向量 AR 模型就足够了.这里我们集中讨论利用扰动过 
程 a , 建立波动率模型. 

根据 10.3 节对 Cholesky 分解的讨论，从到的正交变换只涉及了 < 

/). 另外，的模型只依赖于与< j ) 相关 的量. 从这种意义上讲， 10.4 节建 
立的时兜波动率模型是嵌套的.因此，我们考虑按照下面的一系列程序来建立多元 
波动率模型. 

(1) 选择一个最感兴趣的市场指数或股票收益率.对选择的收益率序列建立一 
个一元波动率模型. 

、」2)将第二个收益率序列扩充到系统中，将扩充后的新收益率序列的扰动过程 
进行正交变换，并对系统建立一个二元波动率模型.第1步中一元模型的参数估计 
可以作为二维估计的初始值 




408 第 10 章多元波动率墣型及其应用 


(3) 将第三个收益率序列扩充到系统中：对新增加的扰动过程进行正交变换，并 
建立一个兰元波动率 模型. 二元模型的参数估计作为三维估计的初始值- 

(4) 继续此扩充直到对所有感兴趣的收益率序列建立了联合波动率模型 
最后，在每一步中进行模型检验以保证所拟合模型的充分性.经验表明这一系 

列程序可以实质性地简化建立髙维波动率模型的复杂性.特别是可以大大减少估计 
的计算时间. 

例 10.6 我们通过对 S&P300 指数、 Cisco 系统股票和 Intel 公司股票的日对数 
收益率建立一个波动率模型来说明上面所提山的•系列 程序. 数据的时间区间是从 
1991 年 1 月 2 日至 1999 年 12 月 31 曰，共 2 27S 个观 测值. 对数收益率以百分 
比表示.图 10-12 给出了其时间图.收益率序列的分垦排序为 r, = (SP5 t! CSCO t! 
INTC t )'. 数据的样本均值、样本标准差和样本相关矩阵为 
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图 10-12 


(a) S^P 5()0 指数 



1992 


1094 


1006 


1998 


200(1 


年 


(b) Ci^co 系统 



年 

(c) Intel 公司 



19«2 1994 199C 1998 20(H) 

年 


S&P500 指数 （ (a ))、 Cisco 系统股票 （ (b)) 和 Intel 公司的股票 （(c)) 的 R 对数收 
益举 （Cf 分比形式）的时间阁，时间区间是从1991年1月2日到1999年12月31日 


利用 Ljung-Box 统计量来识别收益率序列之间的序列相关性，得到 ^3(1) = 
26.20, Q.K4) = 79.73. Q 3 ( S ) = 123.68. 这些检验统计量都是高度显著的，分别与自 
由度为 9, 36 和 72 的 X 2 分布比较：其 P 值都接近于 0. 数据中确实存在某些序列相 
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关性.表 10-1 给出了以第8章中的简单记号表示的样本交叉相关矩砰的前5个延 
迟.检査此表可见 （ a ) S & P 500 指数的日对数收益苹并不依赖子 Ckco 或! ntd 过太 
的收 益率； （ b ) Cisco 股票的对数收益率貝有某些序列相关性，并且依赖于 S & P 500 
指数的过去收益率（见延迟2和 5); ( c ) Intel 股票的对数收益率依赖丁- S & P 500 指 
数的过去收益宇（见延迟1和 5). 这些观测类似于第8章中分析的 IBM 股票和 
S & PS00 指数收益率之间的 结果. 它们表明具有较大资本的单个公司的收益 率倾 ㈤ 

于受市场过去行为的影响.然而，市场收益率并不会受到单个公司过去收益率的显 
著影响. 

表 10-1 S & P 500 指数， Cisco 系统股票和 Intel 公司的股票的日对数收益率的样本交叉相 

_关矩阵.时间区间是从1991年1月2日到1999年12月31日 


间 隔 
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* * 贅 

• • • 
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• • • 

» 參 ■ 
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进而考虑波动率模型、按照所建议的步骤，我们从 S & P 500 指数的对数收益率 
开始，得到模型 


ru =().078+0.042 r li t _ l -0.062 r ,. t _3-0.048 r 1 ,,_4-0.052 r l ,^5- fa lt> 

戊 11 ,* = 0.013+ 0.092(^—! +0.894^*—“ (10.32) 

均值方程中参数的标准误差分别为 0.016, () . () 2 3 , 0 . 020 , 0 . 022 和 0 . 020 ; 波动率方程 
中参 数的巧 准误差分别为 U . UUA 0.006 和 0.007. 一元模型的标准化残差及标准化 
残差平方序列的 Ljung - liox 统计量没有识别出数据中任何余留的序列相关性或条 

件羿方差性.事实上，对标准化残差，我们有 Q ( 10 ) = 7.38(0.69), 而对其平方序列 
g (10) = 3.14(0.98). 

将 Cisco 股票的日对数牧益率扩充到系统中，我们建立一个二元模型具有的 
均值方程为 

=0.065 - 0.()46 ri , 卜 3 + au , 

r 2t =0.325 + 0.1957^-2 - 0.091 r 2 , t _ 2 + a 2i . (10.33) 

其中所有的估计在 1 %的水平下都是统计显著的•利用 Chnlraky 分解的记号我们 
得到波动率方程为 

911 , t = 0.00(3 + 0.051 的 十 0.943^ n tt _ lt 

<72 i，t = 0.331 + 0. 790^21, t-i - 0.041 a 2 , t _ i , (10.34) 

.922 ,t = 0.17’ + 0.0826!, 卜 i + 0.890^22,4—1> 

其中 = a lt , b 2t = a 2t - (/ 2i . tb u . gn . t 方程中参数的标准误差分别为 0.001,0.005 
和 0.006; g 2 i , i 方程中参数的标准误差分别为 0.156,0.099 和 0.01 1 ； g 22A 方程中参数 
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的标准误差分别为 0.029, 0.0【)8和 0.011. 标准化残差的二元 Ljmig - Box 统计量没有 
识別出任何余留的序列相关性弓条件异方差性，从而二元模型是充分的与 (10-32) 
式比较.我们看出 nt 的边际模型和一元模型之间的差别很小 • 

下一步（也是最后步）是将 Intel 股票的日对数收益率扩充到系统中.均值 
方程变为 

rit = 0.065 — 0.043rj^_3 4- 

r 2t = 0.326 + 0.201ri,t_ 2 - 0.089r 2 , e -2 4 - a 2tj (10.35) 

rst — 0.192 — 0.264ri t c-i f 0.059r3 t e-x + a 3t> 

第一个方程中参数的标准误差分别为 0.016 和 0.017; 第一个方程中参数的标准误 
差分别为 0.052,0.()59 和 0.021; 第三个方程中参数的标准误差分别为 0.050,0. U 57 
和 0.022. 大约1%的水平下所有的估计在都是统计显著的.如所料想， n ; 和 a 的 
均值方程与二维情形中的基本相同. 

三维时变波动率模型变得更加复杂，但仍然很容易处理，因为 

7 ii,t = 0.006 + O . OSO^i + 0.943. yn , t - i , 

<721,< — 0.277 十 0.82 句 2i,t 一 1 — ().()35a.2 ， f—i, 

922, t = U.178 + 0.082^2,^— 1 0.889^22,^—11 (10 36) 

qs ht = 0.039 + 0.973 奶 i.u + U.U10a 3 ,t-i, 

^32, t — 0.006 + 0,981 奶 2』-1 + 0.U04o2,i— 1, 

^ 33 , f = 1.188 + 0.05363,t-i + 0.687(/33,e-i ~ 0.019p22,t -1 ， 

其中 felt = ait , — a 2 t — 92 i , tbit , b 3t = a^t — 如 i ,*6 w — 咖，泌2*. 表 10~2 给出了参 
数的标准误差.除了 732 , t 方程中的常数项，所有的估计在 5 %的水平下都是显著的. 
令屯_ ( axi /» <*2 i /^24> °3 t / ^3 t ) 1 为标准化的残差序列，其中在 it : = 是对第 

i 个收益率拟合的条件标准差 . 4的 Ljung Box 统计量给出 Q 3 ( 4 ) = 34.48(0.31), 
Q 3 (8) = 60.42(0.70) .其中 x 2 分布的自由度分别为31和67,该自由度是将均值方 
程屮使用的参数数量调整之后得到的.对: P 残差序列的甲方我们有 Q 3(4) = 
28.71(0.58), W (8) = 52. U 0 I 0.91), 因此，在给条件均值和波动率建模时所拟合的模 
型是充分的. 


衷 10-2 给 S & P 500 指数. Cisco 系统股票和 Intel 公司股票的 R 对数收益率（百分比形 
式） 拟合的三元波动率模型的参数 a 估计值的标准差，时间区间是从1991年1 
月2日到1999年12月31日 a 
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a 参数 出现的顺序与 (10.36 ) 式中的顺序 
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1998 2( X )0 




195)4 1996 1998 2000 

年 

给从 11)91 年1月2日到I" 9 年I 2 月 3 1 日： （ a ) S&P500 指数； （b) Cisco 系 统和; 
(c) Intel 公司的股票的日对数收益率（百分比形式）拟合的波动率的时间图 


图 10-13 


(10.36) 式中的波动率模型包含两套方程.第一套方程描述了条件方差的时间 
演变（即 9 u , t ), 第二套方程处理相关系数（即叫 , t ，i > j )， 对这个特殊的数据集 
合，一个 AR (1) 模型对相关系数方程可能就足够了.类似地，一个简单的 AR 模 
型对条件方差也可能是足够的•定义= ( V U . t ， t ; 22 . t ， ，其中 = ln (< 7 ii)t ), 
= (<7 2 U ， g 3 l , f ，732, t )'. 前面的讨论启示我们可以利用 简黾的 1 步延迟模型 


方程 (10.36) 中的三元波动率模型有一些有趣的特征第一，它本质上是一个 
时变相关的 GARCH(U) 模型. 闵为方 程中只用到了 1步延迟变量.笫二， S&P500 
指数 LJ 对数收益率的波动率不依赖于 Cisco 或 Intel 股票收益率过去的波动率.笫 
三，通过取 Chnlesky 分解的逆变换， Cisco 和 Intel 股票日对数收益率的波动率依 
赖于市场收益率过去的波动率.参见10. 3 节给出的 S t , 私和的元素之间的关 
系.第四，描述相关的量叫. t 有很高的持续性.并具有很大的 AR (1) 系数. 

一图10~1 3 给出了数据拟合模型的波动率过程（即 a ii<t ). 指数收益率的波动率远 
远小于两个单只股票收益率的波动率.图形也表明了指数收益率的波动率近年来已 
经增加，但是 Cisco 系统股票的收益率却并非如此•图 HV 14 给出三种收益率序 
列之间的时变相关 系数. 比较图 10-13 与图 1( M 4 可得到有意思的结论.这些结论 
表明当收益率波动时.两个收益率序列之阆的相关系数是递增的.这与国际股票市 
场指数间关系的实址妍究结果是一致的.两个市场之间的相关性在金融危机期间倾 
向于递增. 
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10.6 因子波动率模型 

简化多元波动率过程动态结构的另一种方法是利用囚子模型.实际中，“公共 
因子”可以通过固有性质或经验方法预先设定.作为说明，我们利用笫 8 章的囚子 
分析来讨论因子波动率 模型. 因为波动率模型关心的是中的条件方差矩阵随时间 
的演变，其中 a t = 所以波动率中识别“公共因于”的一个简单方式是对 a t 

进行主成分分析 ( PCA ). 具体可参见第8章中的 PCA . 这样，建立一个因于波动率 
模型涉及一个三步的 程序： 


0.8 
« (，.7 
喊 0.C 

翠 （).4 
(J.2 


1992 


1994 


年 


1996 


1998 


2 « K)0 


图 10-14 给 S & P 500 指数、 Cisco 系统股票和 Intel 公司股票的日对数收益率拟合的时变相 
关系数的时间图，时间区间是从1991年1月2日到1999年12月31日 


V t = C\ + q t = C 2 + 

作为对资产收益率波动率建模的精确函数，其中^是常向量./3,是 3 X 3 实值矩 
阵.如果前一方程中再加上噪声项，则模型变为 

v t = Ci + /3jVt-i +eu ， q, = c 2 + /3 2 9t-i + e 2t, 

其中 e lt 是均值为 0 的随机扰动，具有正定协方差 矩阵. 并且我们有一个简单的多 
元随机波动率模型•在一个最近的手稿中， Chib , Nardari 和 Slipphard (1999) 利用 
MCMC 方法来研究高维的随机波动率 模型. 那里考虑的模型以一种带限制的方式 
允许时变的相关性.多元波动率模型的其他参考文献包括 Harvey , Ruiz 和 Shephard 
(1995). 在第12章中，我们将讨论波动率建模的 MCMC 方法. 


(a) S\rP m) 指数与 Cisco 系统 
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• 选择前几个主成分，使得它们所能解释的 q 的变化占很髙的百 分比； 

• 对选择的主成分建立一个波动率 模型； 

• 将每个序列的波动率与所选主成分的波动率联系起来. 

这个程序的目的是降低维数，但要保持多元波动率较精确的近似. 

例 10.7 再次考虑例 10.5 中的 IBM 股票和 S&P500 指数以百分比表示的月对数 

收益象利用例 8.4 中的二元 AR(3) 模型.我们得到新息序列 n., 根据~的协方差 
矩阵对 a, 讲行主成分分析，我们得到特征值 G3 373 和 13,189. 第一个特征值解释了 
的广义方差的 82.2%. 因此，我们可以选择第一个主成分: r t = 0.797a lt + 0.604«, 2t 
作为公共因子.另外一种选抒，正如例 8 M 中的模型表明的， n 的序列相关性很弱， 
从而可以直接对 r f 进行主成分 分析. 对这个特例， r < 的样本协方差矩阵的两个特 
征值是 G3. 625 和 13.513, 这与基于叫的结果基本相同•第个主成分近似解释了 
f.t 的广义方差的 82.5%, 对应的公共因子是： = 0.796rn + 0.6057^. 因此，对所考 
虑的两个月对数收益率序列，条件均值方程对 PCA 的影响是可以忽略的. 

根据前面的 i 、 j 论.并且为了简便.对这两个月对数收益率序列，我们使用々= 
0.796 r u + U .( iU 5 r 2 t 作为一个公共因子.图 l ( M 5 a 给出/这个公共因子的时间图. 
如果使用一元卨斯 GARCH 模型，则对&我们得到下面的 模型： 

xt = 1.317 + 0.096o?e-i + = a t c ty 

of - 3.834 + O . llOa , 2 ,! -|- 0 . 825 af_ v (10.37) 

此模型的所有参数估计在1%的水平下都是高度显著的.而且标准化的残差及其平 
方序列的 Ljimg - Box 统计量没有识别出模型的不充分性.图 10-15 b 给出了 a 的 
拟合波动率 （ B 卩 (10.37) 式中的样本4序列). 


( H ) 第 成分 



1940 19CU 1980 2000 

年 

(»») 拟合的波动宇过程 



图 10-15 (a) IBM 股票和 S&P500 指数的月对数收益率的第一主成分的时间图： （b) 基于 

GARCH(1, 1) 模型所拟合的波动率过程 
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利用模型 (10.37) 中的4作为一个共同波动率因子，对于原始的月对数收益 
率，我们得到下面的模型.均值方程为 


r|f. = 1.140 十 0.079ri f t_ | H- 0,067ri，f — 2 — 0.122r2,t— 2 + a it? 
V2t — 0.537 -j- a*2t. 


第一个方程中参数的标准误差分别是0,21 1，( U )30, ().031 和 0.043 ,第二个方程中参 
数的标准误差是 0.165. 条件方差方程为 
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如前一样，小括号内的数值是标准差.疗是从模型 (10.37) 得到的.条件相关系数 
方程为 


二 exp(^t) 

1 +exp(g t )’ 


q, = -2.098 -f 4.120p,_i + 0.078 …，卜 1 a ’ 2t -] 


(10.39) 


三个参数的标准误差分别是 0.025,0.()38 和 0.015. 如前一样定义标准化的残差序 
列，得到 Q 2 (4) = 15.37(0.29), Q 2 ( 8 ) = 34.24(0.23), 其中，小括号内的数值表示 p 
值.因此.标准化的残差没有序列相关性.对其平方序列，有 QH( 4 ) = 20.25(0.09 )， 
Q5(8) = 61.95(0.000 4). 这说明 （ 10.38) 式的波动率模型不能充分处理数据的条件 
异方差性.尤其是在更高延迟时.这并不奇怪.因为单个公共因子仅仅解释了数据 
广义方差的大约 82.5%. 

比较 (10.38) 式和 (10 39) 式中的因子模型与 (10.27) 式和 （ 1(128) 式中的时变 
相关模型，我们看出 （ a) 两个模 M 的相关方程基本相同 ： （ b) 如所料想，在波动率方 
程中，因子模型利用了较少的 参数； （ c) 公共因子模型提供了数据波动宇过程的一 
个合理的近似. 

注释： 例 10.7 中.我们利用了 一个两步估计程序.第一步中.对公共因予建 
立了一个波动率 模型. 第二步中把波动率的估计当作已给定来估计多元波动率模 
型.这样的估计程序很简单，但可能并不 有效. 更加有政的估计程序是进行联合 
估计.这种操作在公共因于已知的条件下相对比较容易.例如，对例 10.7 中的月 
对数收益率，如采认为公共阁于 ; Ef = U.769r u + U.605r 2< 是给定的 ，則 "7 ■以对方程 
(10.7) - (10.39) 进行联合估计. 口 


10.7 应 用 


我们通过考虑多种资产的一个金融头小的 VaR 来说明多兀波动率模型的应用. 
假定投资者持有价值为 1 UU 万美元的 Cisco 系统股票和 Intel 公司股票的一个长期 
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头寸.我们利用两只股票从 U )91 年1月2曰至1999年12月31日的日对数收益 
率建立波动率模型.在数据期间的最后，利用向 前1 步预测和5%的临界值来计算 
VaR . 

令 VaR ! 表示持有 Cism 系统股票头寸的 VaR , 并令 VaR 2 表示持有 Intel 股 
票头寸的 VaR . 第7章中的结果证明了投资者总的日 VaR 为 

VaR = yj VaR ? + VaR 《 + 2/> VaR ! VaR 2 . 

在这个解释中，我们考虑计算 VaR 的波动率模型的=种方法.为了简便.我们没有 
对涉及的参数或模型检验统计量报告其标准误差.所有的参数估计在5%的水平下 
都是统计显 著的. 而且根据标准化的残差序列及其平方序列的 Ljuug Box 统计量可 
知该模型是充分的.对数收益以百分比表示，以致 VaR 计算中的分位数除了 10(). 
令 r u 表示 Cisco 系统股票的收益率，表示 Intel 股栗的收益率. 

一元模型 

此方法对每只股票收益率都使用一元波动率模型，并用股票收益率的样本相关 
系数估计 p. 两只股票收益率的一元波动率模型为 

= 0,380 | 0.034r“f 一 1 0.061r 2 — ().055ri, 卜 3 + a u ， 

< rf t -0.599 + 十 0.814 a ? ，卜 工， 

r 2 t =0.187 十 （ t2t , 

=0.310 + 0.032 a | + 0.918^71^4. 

样本相关系数为 0.473. VaR 计算中需要以^ = 2 275为预测原点的向前1步预测 
为 

ri = 0.626, af = 4.152, r 2 = 0.187, a \ = 6.087, p = 0.473. 

两个日收益率的5%分位数为 

<7 i = 0.626 - 1.65\/4.152 = -2.736, q 2 = 0.1 87 - 1.65\/«.087 = -3.884. 

其中负号表示损失.单只股票的 VaR 为 

VaR x = $1 000 00() 91 /1 U 0 = $27 360， VaR 2 = $1 000 UUU^/lUO = $38 840. 

因此,投资者总的 VaR 为 VaR = $57 117. 

常相关二元糢型 

此方法对股票收益率釆用一个二元 GARCH ( l . l ) 模型.假定相关系数随时间 
固定不变，但它可以与其他参数联合估计.模型为 


r u =0.385+ 0.038r l , t _i - 0.060ri tl _2 - 0.047n. t _ 3 + 

t’2t = ().222 十 ri2 卜 

cr\\ y t =0.624+ 0.U0a?^ 1 + 0.816a u • 卜 ！， 
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(T22.I =0.664 + + 0.853<722, t-i ， 

p = 0.475. 

这是一个对角的二元 GARCH(U) 模型 . VaR 计算中在预测点/ = 2 275 的 1 步向 
前预测为 

fi = 0.373, a\ = 4.287, r 2 = 0.222, cr\ = 5.706, p = 0.475. 

因此，我们有 

VaR, = $30 432, VaR 2 = $37 195. 

投资者总的 5% 的 VaR 为 VaR = $58 180. 

时变相关模型 

最后，通过 Cholesky 分解我们允许相关系数随时间变化.拟合的模型为 
T\i =0.355 十 0.039ri^_i — ().057ri ， 卜 2 — 0.038rx t e— 3 + a \t> 

T2t =0.206 + a^ty 

= 0.420-h 0.0916?^，! 4- 0.8585n,i-i, 

(]2\,t = 0.123 + 0.689<72i ,t-i — 0.014a2,t-i, 

.922.< = 0.080 + O.D136i (t _ 1 4- 0.971p 2 2,£-i, 

其中 = ftu ， fc 2i = « 2e - g 21 , t0 . lt . VaR 计算所需的在预测点 A = 2 275 处的 1 步 
向前预测为 

r, = 0.352, f 2 = 0.206 ， 々 u = 4.252, q 2 \ = 0.421, g 22 = 5.594. 

因此.我们有 4 = 4.252, & 2i = 1.701. &l = 6.348. 相关系数为卢 = 0.345. 利用这些 
预测.我们有 VaR, - $30 504, Vall 2 - $39 512. 总风险值 VaR - $57 648. 

三个方法的 VaR 估计是类似的.一元模型给山了最低的 VaR, 而常相关模型 
产生了最高的 VaR. 差别大约为 1 100 美兀.时变波动率模型是两个极端模型的中 
和. 


10.8 多元 f 分布 


实证分析表明，前一节屮使用的多元高斯新息可能不能刻画资产收益率的峰 
度.在这种情形下，多元学生分介可能是有用的.存在许多形式的多元学生/- 
分布.这里对波动率的建模，我们给出一个简单的形式. 

称 k 维随机向童 z = ( si ,-. - ,x k y 服从自由度为〜参数为 m = 0, s = /(单 
位矩阵）的多元学生 t -分布，如果其概率密度函数 （ pdf ) 为 

/(x|w) - \^ r ( Sh {l + v_la ^)__ /2 ， （ 10 . 40 ) 
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其中 V ( y ) 是伽马函数.参见 Mardia , Kent 和 Bibby (1979. p 57). (10.40) 式的每个 
分量 A 的方差为 u/k - 2), 从而定义 - 2 )/vx 为自由度为 I ，的标准化的 
多元学生分布.通过变换，的概率分布密度函数是 

⑽ ) = [,(^- 2)1^^/2)^ + 卜幻-如- ㈣ ， (10-41) 

对波动率模型 ， id a f = E ； /2 £ t , 并假定 e , 服从 (10.40) 式中的多元学生 f - 分布. 
通过变换.的概率密度函数是 

f(a,\v,J ： t )= ㈨ v _ 【治 + (^-2)- 1 o ； Er 1 a<l (v ' 4fc)/2 . 

而且，如果我们利用 S , 的 Cholesky 分解，则变换后的扰动 b t 的概率分布密度函 
数变为 


f { b t \ v , L t , G t ) = 


r (〜 + k )/2) 

[^ - 2)]^T( v /2) nU^i 2 t 


k 

l + ( v -2)- 1 ^ 


3 l _ 

Ojj,t 


- {v+k)/2 


其中 a , = 1,知，是心的条件方差.因为这个概率密度函数并不包含任何矩阵 
的逆，所以很容易计算数据的条件似然函数. 


附录对估 计的一 些注释 

本章中多元 ARMA 模型的估计是利用“科学计算帮手”中的时间序列程序 
SCA 进 行的. 多元波动率模型的估计可以利用 S-plus 中的 FinMetrics 或时间序列 
的回归分析 ( RATS ) 程序进行.下面是利用 RATS 程序估计多元波动率模型的一 
些运行流程.以“ *” 开始的行表示“注解 

例 10.5 中的对角常相关 AR (2)- GARCII (1,1) 模型的估计 

该程序包括对每一个分量的一些 Ljung-Box 统计量以及最后几个观测的一些 
拟合值.数据文件为 m - ibmspln . dat ， 有两列共888个观测. 

all 0 888:1 

open data m-ibmsp 丄 n.txt 
data(org=obs) / rl r2 
set hi = 0.0 
set h2 = 0.0 

nonlin aO al bl aOO all bll rho cl c2 pi 
frml alt = rl(t)-cl-pl*r2(t-1) 
frml a2t = r2(t)-c2 

trm 丄 gvarl = a0+al*alt(t-1)**2+bl*hl(t-1) 
frml gvar2 = a00+all*a2t(t-l>**2+bll*h2 

frml gdet =* -0.5 # (log (hi (t) =gvarl (t) ) -»-log (h2 (t) =gvar2 (t) ) $ 

-f log (1.0-rho*^2)) 
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frml gin = gdet(t)-0,5 / (1.0-rho*^2)♦((alt(t) # *2/hl(t)) $ 

♦(a2t(t)**2/h2(t))-2*rho*alt(c)*a2t(c)/sqrt(hi(t) *h2 (t)) 
smpl 3 888 

compute cl = 1.22, c2 = 0.57, pi « 0.1, rho = 0.1 

compute aO = 3.27, al = 0.1, bl = 0.6 

compute aOO = 1.17, all = 0.13 # bll ■ 0.8 

maximize(method=bhhh # recursive,iterations=150) gin 

set fvl = gvarl(t) 

set resil = alt(t)/sqrt(fvl(t)) 

set residsg = resil(t)*resil(t) 

* Checking standardized residuals * 
cor(qstats,number=12,span=4) resil 

* Checking squared standardized residuals * 
cor(qstats,number=12 f span=4) residsq 

set fv2 = gvar2(t) 

set resi2 = a2t(t)/sqrt(fv2(t)) 

set residsq = resi2(t)*resi2(t) 

* Checking standardized residuals * 
cor(qstats,number=l2 # span=4) resi2 

* Checking squared standardized residuals * 
cor(qstats,number=12 # span=4) residsq 

* Last few observations needed for computing forecasts * 
tseL ahuckl = dlt (t) 

set shock2 = a2t (t) 

print 885 888 shock1 shock2 fvl fv2 

例 10.5 中的时变相关系数模型的估计 

all 0 888:1 

open data m-ibmspln.txt 
data(org=obs) / rl r2 
set hi = 45.0 
set h2 = 31.0 
Get rho - 0.8 

nonlin aO al bl £1 aOO all bll dll fll cl c2 pi p3 qO ql q2 
frml alt = rl(t)-cl-p ： *rl(t-1)-p3*r2(t-2) 
frml a2t = r2(t)-c2 

frml qvarl = a0+al*alt(t>l)**2+bl*hl(t-l>+fl*h2(t>l) 
frml gvar2 = a00+all*a2t(t-1)**2+bll*h2(t-l>+fll*hl(t-1) $ 
+dll*alt(t-1) 

frml rhl = qO + ql*rho(t-l) $ 

+ q2*alt(t-1)*a2t(t-1)/sqrt(hl(t-l)*h2(t-1)) 
frml rh 二 exp(rhl(t))/(1+exp(rhl(t))) 

frml gdet - -0.5^ (log (hi (t) -gvarl (t) ) 4-log (h2 (t) =gvar2 (t) ) $ 
♦log(1.0-(rho(t)=rh(t))**2)) 

frml gin = gdet • 5/(1 • 0-rho <t) **2) * ( (alt (t) **2/hl (t) > $ 

a- (a2t (t) **2/h2 (t) ) -2* rho (t) *alt (t) *a2t (t) /eqrt. (hi 《 t> *h2 (t))> 
smpl 4 888 

compute cl = 1.4, c2 = 0.7, pi = 0.1 # p3 = -0.1 
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compute aO = 2.95, al = 0.08, bl = 0.87, fl = - # 03 
compute aOO = 2.05 r all = 0.05 

compute bll = 0.^2, f11.06 r dll=.04, qO = -2.0 

compute ql = 3.0, q2 = 0.1 

nlpar(criterion=value,cvcrit=0.00001) 

maximize (method=blihli # recursive, iterations = 150) gin 

set fvl = gvarl(t) 

set resil = alt(t)/sqrt(fvl(t)) 

set residsq = resil(t)*resil(t) 

* Checking standardized reaidudlB * 
cor(qstats # number=16,span=4) resil 

* Checking squared standardized residuals * 
cor(qstats,number=16,span-4) residsq 

set fv2 * gvar2(t) 

reai2 = a2t(t)/sqrt(fv2(t)) 
set residsq = resi2(t)*resi2(t) 

* Checking standardized residuals * 
cor(qstats,number=16 # span=4) resi2 

* Checking gcjuared standardized reoidualo * 
cor(qstats,number=16,span=4) residsq 

* Last few observations needed for computing forecasts * 
set rhohat = rho(t) 

set shockl * alt(t) 
set shock2 = a2t (t) 

print 885 888 shockl shock2 fvl fv2 rhohat 

利用 Cholesky 分解进行例 10.5 中的时变相关系数模型的估计 

all 0 888:1 

open data m-ibmspln. txt 
data(org=obs) / rl r2 
set: hi = 45.0 
set h2 = 20.0 
set q = 0.8 

nonlin a0 al bl aOO dll bll dll fll cl c2 pi p3 tO tl t2 
frml alt = rl(t)-rl-pl*rl(t-1)-p3*r2(t-2) 
frml a2t = r2(t)-c2 

frml vl = a0+al*alt(t-1)**2+bl*hl(t-1) 
frml qL = to + tl*q(t-l) + t2*a2t(t-l} 
frml bt = a?.t(t) - (q(t) =qt (t) ) *alt (t) 
frml v2 = a00+all*bt(t-1)**2+bll*h2(t-1)+fll*hl(t-1) $ 
+dll*alt(t-1)**2 

frml gdet = -0.5*(log(hi(t) = vl(C)) + log(h2(t)=v2(t))) 
frml garchln = gdf?t-n .5* (alt (t) **2/hl (t) +bt (t) **2/h2 (t)) 
smpl 5 888 

compute cl = 1.4, c2 = 0.7, pi = 0.1, p3 = -0.1 
compute aO = 1.0, al = 0.08, bl = 0.87 
compute aOO = 2.0, all = 0.05, bll = 0.fi 
compute dll=.04, fll=-.06, tO =0.2, tl = 0.1, t2 = 0.1 
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nlpar(criterion=value,everit =0 .00001) 

maximize(method=bhhh # recursive,iterations=150) garch 丄 n 
aet fvl = vl(t) 

set 1 = alt (t) /sqrt (fvl (t)) 

set residsq = resil(t)*resil(t) 

* Checking standardized residuals * 
cor(qstacs,number=16,span=4) reail 

* Checking squared standard! zed duals * 

cor(gstats,number=16,span=4) residsq 

set fv2 * v2(t)+qt(t)**2*vl(t} 
set resi2 = a2t(t)/sqrt(fv2(t)) 
set residsq = resi2(t)*resi2(t) 

* Checkinq standardized residuals * 
cor(qstats # number=16,span=4) resi2 

* Checking squared standardized residuals * 
cor(qstats , number=16 # span“4) residsq 

* Last few observations needed for forecasts * 
set rhohat = qt(t)*sqrt(vl(t)/fv2(t)) 

set shockl = alt(t) 
set shock2 = a2t(t) 
set g22 • v2(t) 
set q21 * qt(t) 
set b2t = bt(t) 

print 885 888 shockl shocks fvl fv2 rhohat g22 q21 b2t 

利用 Cholesky 分解进行例 1CK6 中的三元时变相关系数波动率模型的估计 

初始的估计值是由序贯建模力法给出. 

all 0 2275:1 

open data d-cscointc.txt 

data(org=obs) / rl r2-r3 

set hi = 1.0 

set h2 = 4.0 

set h3 = 3.0 

set q21 = 0.8 

set q31 = 0.3 

set q32 = 0.3 

nonlin cl c2 c3 p3 p21 p22 p31 p33 a0 al a2 t:0 Cl t2 bO bl $ 
b2 uO ul u2 wO wl w2 dO dl d2 d5 
frml alt = rl(t)-cl-p3*rl(t-3) 
frml a2t = r 2 (t 卜 c2-p21*rl(t-2>-p22*r2(t-2) 
frml a3t = r3(t)-c 3 -p 3 l*rl(L-l)-p33^r3(t-1) 
frml vl = aO+al*alt (t-l> **2+a2*hl 
frml qlt = t0 + tl*q21 (t>l) + t2^a2t (t-1) 
frml bt * a2t(t) - (q21 (t) =qlt (t) )*alt(t) 
frml v2 = bO+L>l*bl 十 b2*h2 (t-l> 
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frml q2t = uO + ul*q31(t-1) + u2*a3t(t-1) 

firml q3t = wO + Wl*q32 (t-1) + W2*a2t (t-1) 

frml bit = a3t(t)-(q31(t)-q2t(t))*alt(t) - (q32(t)=q3t(t))*bt(t) 

frml v3 = dO+dl*blt(t-1)**2+d2*h3(t-1)+d5*h2(t-1) 

frml gdet = -0.5*(log(hi(t) = vl(t)) + log(h2(t)=v2(t)) $ 

+loy Ui3 (t) =v3 (C))) 

frml garchln = gdet-0 . (alt (t) **2/hl (t) +bt (t) **2/h2 (t) $ 

+blt(t)**2/h3(t)) 

smpl 8 2275 

compute cl ■= 0.07, c2 = 0.33, c3 = 0.19, pi = 0.1, p3 = -0.04 

compute p21 =0.2, p22 = -0.1, p31 = -0.26, p33 =0.06 

compute aO = .01, al = 0.05, a2 = 0.94 

compute tO = 0.28, tl =0.82, t2 = -0.035 

compute bO = .17, bl - 0.06, b2 = 0.89 

compute u0= 0.04, ul = 0.97, u2 = 0.01 

compute wO =0.006, wl=0.98, w2=0.004 

compute do =1.38, dl = 0.06, d2 = 0.64, d5 = -0.027 

nlpar(criterion=value,cvcrit=0•00001) 

maximize(method=bhhh,recursive,iterations=250) garchln 

set fvl = vl(t) 

set resil = alt(t)/sqrt(fvl(t)) 
set residsq = reeil(t)*reoil(t) 

* Checking standardized residuals * 
cor (qstats, nutnber=12, span=4) resil 

* Checking squared standardized residuals * 
cor(qstats,number=12,span-4) residsq 

set fv2 = v2(t)+qlt(t)**2*vl(t) 
set resi2 = a2t(t)/sqrt(fv2(t)) 
set reuidsq = resi2(t)*resi2(t) 

* Checking standardized residuals * 
cor(qstats,number=12,span=4) resi2 

* Checking squared standardized residuals * 
cor(qstats,number=12,span=4) residsq 

set fv3 = v3(t)+q2t(t)**2*vl (t)+q3t(t)**2*v2(t) 
set reai3 = a3t(t)/sqrt(fv3(t)) 
set residsq = resi3(t)*resi3(t) 

* Checking aLdndardlzed residuals * 
cor (qstaf-R , number=12 , span^4 ) resi3 

* Checking squared standardized residuals * 
cor(qstats,number=12,span=4) residsq 

* print standardized residuals and correlation-coefficients 
set rho21 = qlt (t) *aqrt- (vl (t) /fv2 (t)) 

set rho31 = q2t(t> *sqrt(vl(t)/fv3(t)) 
set rho32 = (q2t(tl*qlt(t)*vl(t) $ 

+q3t(t)*v2(t))/sqrt{fv2(L)»Cv3(t)) 
print 10 2275 resil resi2 resi3 

print 10 2275 rho21 rho31 rho32 
print 10 2275 fvl fv2 fv3 
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练习题 

10.1 考虑 S & P 综合指数、 IBM 股票和 Hewlett - Packard ( HPQ ) 股票从1926年 I 月至2003年 
12月的月对数收益率，共504个观测值.对数收益率数据在文件 m - spibmhpq 6203. txt 中. 
对于这三个对数收益率序列.利用衍数加权滑动平均方法获得多兀波动率序列_ A 的估计 
值是多 少_/ _出这个波动率序列的时间图. 

10.2 讨论 IBM 股粟和 HPQ 股票从 1926 年丨月至 2003 年 12 月的月对数收益率.为这个二 
元收益串序列 拟合个 DVEC (1, 1) 模型. 该模型是否充分？ _山所拟合的波动率序列和 
时变相关系数的时间图. 

10.3 讨论 S&P 综合指数和 HPQ 股票的月对数收益率，为这个•元序列建立一个 BEKK 模 
型所拟合的模型是什么？ _出所拟合的波动率序列和时变相关系数的时间图. 

10.4 为 S & P 综合指数、 IBM 股票和 HPQ 股票3个月对数收益率建立一个常相关波动率模 
型.给出所拟合的模型，该模型是否充分？为什么？ 

10.5 文件 B - spibmge . txt 包含了 S & P 500 指数、 IBM 股票、通用电气股票从1926年1月至 
1999年12月的月对数收益率.收益率包括了分红并以百分比表示，讨论通用电气股票和 
S & P 5 U 0 指数以百分比表示的月对数收益率.对这个二元序列建立一个常相关 GARCH 模 
型.检验拟合模型的充分性.并得到协方差矩阵以1999年12月为预测原点的向前1步预 
测. 

10.6 讨论以百分比表示的 GF , 股票和 S & P 500 指数的月对数收益率.并对这个二元序列建3： 
-个时变相关的 GARCH 模型，并对相关系数利用 logistic 凼数.检验拟合模型的允分性, 
并得到协方差矩阵以 199 U 年月为预测原点的向前丨步预测 • 

10.7 H 论以百分比表示的通 ffl 电气股栗和 S&P500 指数的月对数收益率.对这个二元序列利用 
Chulcsky 分解建立个时变相关的 GARCH 模型.检验拟合模型的充分性，并得到协方 
茇矩阵以 1999 年 12 月为预测原点的向前 1 步预测.比较所得模型与前面两个问题中所 
得的模型. 

10.8 考虑三维收益率序列.利用 Cholesky 分解给数据建立多元时变相关波动率模型.讨论模 
型的涵义，并计算预测原点为 < = 888的向前1步波动率预测倌. 

10.9 —位投资者想知道他持有50万美元的 Dctl 股票和100万美元 Cisco Systems 股票的多 
头头寸的风险值 （ VaR ). 用从1990年1月 2() 日到1999年12月31日的日对数收益率 
和5%的临界值来计算.数据在文件 d-dellcsco9099.txt. 运用 10.7 节介绍的波动率建模 
的三种方法，并对结果进行比较. 
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状态空间模型为时间序列分析提供了一种灵活的方法.尤其是在简化最大似然 
估计和处理缺失值方面.本章将讨论状态空间模型和 ARIMA 模型的关系、卡尔曼 
滤波算法、各种平滑方法及一幽 应用. 在引进一般的状态空间模型之前，我们先介 
绍一个简单模型.该模想体现了状态空间方法应用于时间序列分析的基本思想•为 
了对这个简单模型作进一步说明，我们用该模型来分析某公司资产收益率的已实现 
波动率序列、时变系数的市场模型以及每只股票的季度收益序列. 

许多书都讨论了如何利用状态空间模型进行统汁分析 . Durbin and Koopnmn 
(2001) 给出了状态空间模型最近的一•些处理方法 ； Kim and Nelson (1099) 则集中 
讨 论了状态空间模型在经济和体制转换中的应用 ； Amlersuu ami Moore (1979) 对 
于状态空问模型方法的理论和应用给出了很好的概括（主要是工程和最优控制方 
面).许多时间序列的教科书都包含了状态空间模型和卡尔曼滤波方面的内容，例 
如 ， Chan (2002), Shumway and Stotfer (20 UU ), Hamilton (1994) 和 Harvey (1993) 中 
都有章节讨论该问题 . West and Harrison (1997) 给出了一种贝叶斯处理方法.其重 
点在于预测.而 Kitagawa and Gersch (1996) 则使用 f 一种平滑的先验方法 • 

卡尔曼滤波和平滑算法的推导必然要用到大量的符号.因此,若读者只对状态 
空间模型的概念和应用感兴趣,那么相对来说 11.4 节将比较枯燥，故初次阅读时可 
以跳过不读. 


11.1 局部趋势模型 

考虑一元时间序列％，满足 

yt = l^t + et , e t 〜 iV (0, o ^)， (11 1) 

= /it + Th, ” 〜 •/V(0,o ^)， （ 11-2) 

其中 ef 和 7/ f 是独立的白噪声序列 = 1, • • • , T . 初始值 pi 或者给定，或者服从一 ' 
个己知的分布，且与和价独立 （f > 0). 这里川是第 2 章中的随机游走，初始 
值为 AM ; 讲 是叫 的观测版本，只多了噪声 e t . 在文献中，叫称为序列的趋势，并不 
能直接观测到，而奶是观测数据，其观测噪声为 e t .由 T e < 是序列不相关的，故 
的动态依赖性由糾的动态依赖性所决定 • 

利用 (11.1) 式和 （11.21 式的模型可以很容易地分析某项资产价格的已实现波 
动率，可参见下血的例 11.1 这里川代表资产价格潜在的对数波动率 K 是已实现 




11.1 局部趋势模型 425 


波动率的对数.真正的对数波动率并不能被直接观测到，但它可根据随机游动模型 
而随时间演变.另一方面， w 由高频交易数据构建.从而受到市场微观结构影响的 
约束. e < 的标准差代表刻度，用来衡量市场微观结构的影晌. 

(11-1) 式和 (11.2) 式的模型是 一个特殊的线性高斯状态空间模型 (linear Gaus ¬ 
sian state-space model ). 变 M / i ,. 代表系统在 / 时刻的状态且不能被直接观测 
到. (11.1) 式给出了数据％和状态〜的联系，称 为测量误差为的观測方 
程 (observation equation with tlic measurement error ej ). (11.2) 式决定了状态变 
量随时间的演变方式，称为新息为 的状态方程 （或 状态转移方程). Durbin nud 
Koopman ('2001) 也称该模型为 局部水平樸型 (local level model ). 另夕卜，该模型是 
Harvey (1993) 中结构 N 间序列模型 (structural time series model ) 的 一 种简单情形. 

与 ARIMA 模型的关系 

如果 (11.1) 式中没有测量误差，即〜= 0,则//,=糾.此时模型变为 ARIMA 
(0, 1， 0) 模型.若〜 > 0,即存在测最误差 ，则队 为满足下式的 ARIMA (0,1,1) 模型 

(1 - B)yt = (1 - 6B)a tl (11.3) 

其中是均值为零方差为 d 的高斯白噪声.0和4的倌由％和％决定.下 
面给出 T 该结果的推导. 

由 （11.2) 式，我们有 

(1 - = ijt nt+i = ^ j B Vt - 

利用该结果可以将 (11.1) 式改写为 

1 

Vt = ^ _ D vt-1 + et. 

上式两端同时乘以 （1 - 0)，我们得到 

(1 一 B)y t = 77 / -1 +e t — e t - i . 

令 （1 — =叫，可以得到 u ;, = ru - i + e t - e t -\. 在前面的假定卜，很容易看出 

( a ) 服从高斯分布； （ b ) \ ZnT ( w t ) = 2 a ^ + ( c ) Cov [ w t , Wi - i ) = —( d ) j > 1 

时，有 Cov { w t , w t - j ) = 0. 因此 服从 MA (1) 模型. 可以写成 = (1 - 9 B ) a t . 
通过让 w ;, = (1 - 9 B ) a t = + e t - e , , 的方差和延迟为 1 的协方差相等，可以 
得到 

(1 + d 2 )<r 2 a = 2al + a^, 0a 2 a = a\. 

对于给定的 < 和 考虑上述两式的比值便可以得到一个关于6?的二次函数.该 
二次方程有两个解，我们必须选择满足|0| < 1的那个解 . 4可以很容易得到.于 
是， (11.1) 式和 (11.2) 式的状态空间模型也是 ARIMA(0 ? 1,1) 模型.它是第 2 章中 
的简单指数平滑模型. 
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另一方面.对于 0 为正的 AR1MA(0,1,1) 模型，可以利用上述两个等式解出 4 
和 <，并且得到一个局部趋势模型.如果0为负，模型可以写成不带观测误差（即 
^ = 0) 的状态空间的形式.事实上，我们以后将会看到， ARLMA 模型可以通过 
多种方法变换为状态空间模型.因此.线性状态空间模型与 ARJMA 模型是密切相 
关的. 

在实际中，人们只能观测到序列 y t . 因此，若只是基于数据，则是利用 ARIMA 
模型进行决策还是利用线性状态空间模型进行决策并不关键.两个 模哦都 有优缺 
点.在选择统计模型时，数据分析的目的，本质问题和经验都起到了很重要的作用. 
例 11.1 为了说明状态空间模型和卡尔曼滤波的思想，我们考虑 Alcoa 股票一天 
内的 Q 实现波动率.时间区间是从2003年1月2 口到2004年5月7 口，共340个 
观测.所用的日已实现波动率是一 X 内每隔 10 分钟的对数收益率的平方和，其中 
对数收益率以百分比形式给出.计算中没有用隔夜的收益率，即不用当天内的第一 
个 1 U 分钟的收益率.关于已实现波动率的更多信息可参见第3章.演示中所用的 
序列是日已实现波动率的对数. 

图 11-1 给出了 Alcoa 股票己实现波动率对数的时间图，时间区间是从2003 
年1月2日到2004年5月7日.交易数据来自 NYSE 的 TAQ 数据库.若采用 
ARIMA 模型，我们得到下述 ARIMA (0,1,1) 模型 

(1 — B ) y t = (1 - ().855 i ^) a t , d a = U .5184, (11.4) 

其中&已实现波动宇的对数 . 的标准误差是 0.029. 残差序列给出 Q (12) = 12.4, 
V 值是 0.33, 这表明残差中没有显著的序列相关性.类似地，残差序列的平方给出 
Q (12) = 8.2, p 值是 0.77, 这表明序列没有 ARCH 效应. 



图 11-1 Alcoa 股票-天内的已实现波动率对数的时间图，时间 K 间是从2003年1月2闩 
到2004年5月7日.已实现波动率用一天内每隔10分钟的对数收益率计算，其 
中对数收益寧以百分比形式给出 
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由于6是正的，我们可以将 ARIMA (0，1，1) 模型转换为 (11.1) 式和 (11.2) 式的 
局部趋势模型.两个参数的最大似然估计分别为弋= n . f )73 5和\ = 0 480 3.测 
量误差比状态新息有更大的方差1这证实了一天内的高频收益率要受到测量误差的 
约束.估计的细节将在 11.1.7 节给出.这里把这两个估计看成是给定的.并且只是 
用该模型来说明卡尔曼滤波的应用. 

11 . 1.1 统计推断 

回到 (11.1) 式和 (11.2) 式的状态空间模型.分析的目的是由数据 { y # = 
和模型来推断状态 w 的性质.文献中经常讨论的有三种类型的推断. 
它们是滤波 ( filterinK ) 、预测 ( prediction ) 和平滑 ( smoothing ). 令 F , = 为 

t 时刻 （包含 /时刻）已经得到的信息.且假定模型（包括所有参数）是已知的.下 
面简要描述一下这三类推断. 

• 滤波： 滤波意味着给定 F , 恢复状态变量即从数据中移除测量误差. 

• 预测，预测意味着给定 F , 预测或 / j . > (h K 中/是预测原点. 

• 平滑： 平滑是指给定 f t , 估计这里 r > t . 

关于这三种炎型推断的一个简单的类比是读于写的注释.滤波是根据由注释幵始 
所积累的知识来领会你要读的单词.预测是猜想下一个单词，而 T 滑是•旦你己经 
读了一遍注释，去解释•个特定的单词. 

为了更精确地描述推断，我们引进一些符兮.令和= 
Var (糾|6)分别为在给定条件下的条件均值和条件力差.类似地，表 
示 Vt 在给定6条件下的条件 均值. 进一步，令内= y t - y t ] t - i 和 Vi = Var ( v t | F f _,) 
分别为 A 前一步预测误差和价在给定尺-1条件卜的条件方差.值得注意的是， 
预测误差 W 与尺―,是独立的.因此〜的条件方差和无条件方差是相同的，即 
VarCtvIi ^- i ) = Var ( Q ). 由 （11.1) 式， 

Vt\t-i = E(y t |Ft_i) = E("f 十 ei|Ff_i) — E(^<|i r l( _i ) =師 

因此，有 

v t = yt - yt \ t -\ = yt - (11.5) 

且 

K = Var ( 奶 - = Var(/i, + e* - 

=Var(// t - I Varhli^-i) = 上 + erg. (ll.G) 

很容易看出， 

E(v t ) = E[E(i; e |Ft_i)] = E[E(y t — Vt|t-i|F<_i)] = —帅 _i] = 0 ， 

Cov{v t ,yj) = E(v t yj) = E[E ( 的 = E[^E(t.' t |F t _i)] = 0 j < t. 
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于是.如所料想，向前一步预测误差与乂 (j < f) 不相关，从而独立.进一步，对 
于 (11.1) 式和 (11.2) 式的线性模型，有/_ = EMFt ) = E (川 Hi , 叫）且= 
Var^lF,) = Var^l^-i，^). 换言之，信息集 K 可以写成 f； = { F t ^, y t } 
{ F t - i , v t }. 

下面给出多元正态分布的一些性质，它们对于研究正态假定下的卡尔曼滤波非 
常有用可以利用多元线性回归方法或联合密度的因子化方法来证明这些性质，也 
可以参见第8章的附录 B . 对于随机向量访和 m , 其均值向量和协方差矩阵分别 
表不为 E («?) = £(771) = ^^* Cov ( m , w ) = S mu( . 

定理 11.1 假设 x . y , z 是联合分布为多元正态分布的随机向量.另外.对 P W = 
avy ， z , 假定对角分块协方差矩阵 T ： ww 是非奇异的，且 Sp = 0.则 

(1) E ( x | j /) = / x * + I ： xv J ： v ^{ y - fi y ); 

(2) Var(x|y) = E xx - S XX S~J E wx ; 

(3) E ( x \ y , z ) = E(ac|y) + S IS E~ ? l (z - #xj; 

(4) Var(®|y,z) = Var(*|y) - 

11 . 1.2 卡尔曼滤波 

卡尔曼滤波 (Kalman filter) 的目 标是： 当获得一个新的数据点时递归地更新状 
态变量的信息.即已知~在给定条件下的条件分布和新 数据？ /,，我们意欲 
得到糾在给定 R 条件下的条件分布，与前面一样，这里巧={&，••• , Vj }. 由于 
F t = {F , 从而 给出昃 和的与给出仄_,和2/,是等价的-因此：我们只要 
知道在给定 F t -i 条件下的条件分布，便可以利用定理 11.1 推导出卡尔曼 
滤波. 

叫在给定 F t _! 条什下的条件分布是均值为零的正态分布，方差由 (11. G ) 式给 
出在给定 F t _! 条件下的条件分布 fe 是正态分布，且其均值为 . 方差为 
进一步， ( f i t , v t y 在给定条件下的条件分布也是正态的.因此，剩下的 
问题是求出糾和 v t 在给定条件下的条件协方差.由定义， 

Cov { nt , v t \ Ft - i ) - E (^ t ^ t | F t _ i ) = E [/ i f (7 / t - nt\t i )| Fn-ij (由 Eq . (11.5)) 

= + e t — 

=E[(/i t - /i t |« i) 2 !^-!] = Var(// t |F t _i) = 5： t | f lt (11-7) 

这里我们用到 / — Ht \ t - i)|^i- i ] = 0. 将上述结果综合在一起，我们有 


W 

〜 JV 1 




: v t. 

Ft^x \ 

. 0 . 
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由定理 11.1 知 ，仏 在给定巧条件下的条件分布是正态的.且均值和方差分别为 


^t\t = + 


~vT 


="t|t—l + Kt.v t , 


( 11 . 8 ) 


^t\t = - 


Sjf|e i 
~vT 


= 1(1 ~ ^t)> 


(ii.9) 


其中仏 = 是 / it 关于 《; t 做回归 的回归 系数.通常称为卜尔曼增益 (KMlumn 
•由 (11.8) 式知，卡尔曼增益决定了新扰动 q 对状态变量 / z t 的贡献. 

接下来，我们可以通过 (11.2) 式利用川在给定6条件下的信息来预测 
具体地.我们有 


^ t + i\t = E (弘 t + rit \ F t ) = E (^ t \ Fi ) = (11.10) 


= Var^t^j F t ) = V&r(fi t \F t ) 4 - Var(r/(() = E t | t + (11.11) 

一旦观测到新的数据点 y t + l . 便可以重复上面的步骤来更新 / if + | 的信息.这就是 
箸名的卡尔曼滤波箅法.该算法由卡尔曼于 I 960 年提出. 

综上所述，将 (11.5) (11.11) 式放在起，在初始假定.即 A 的分布是 

S Mo ) 成立的条件下，局部趋势模型的卡尔曼滤波为 


v t=yt 

= ^<|<-1 + 0^1 

^t = (11.12) 

= l l t\t-\ + KtVt, 

十 i|t _ Ef|t-1 (1 _ K) + 4 ， 尤 = 1 ， … ， T. 

卡尔曼滤波的推导方法有很 多种. 为了简便，我们这里是利用定理 11 . 1 , 即多 
元 TF 态分布的性质来推导的.在实际中，初始值 / i 1|0 和 E 1|0 的选取值得注意.关 
于该问题我们将在 11.1.6 节进行讨论.对于 (11.1) 式和 (11.2) 式给出的局部趋势 
模型，参数 〜和巧 可以通过最大似然方法估计出来.此外，在估计过程中，卡尔 
曼滤波在求数据的似然函数时也很有用.我们将在 11.1.7 节讨论估计问题. 

例 11.1( 续）为了说明卡尔曼滤波的应用.我们给 Alum 股票收益率的日已实现 
波动率拟合了状态空间模型并将尔曼滤波算法应用于该数据.这里 E 1|D = X , 
_ = 0. 11. G 节将讨论这些初始值的选取.图 ll -2 a 给出了滤波状态变量的 
时间图.图 ll -；2 b 给出了向前一步预测误差％的 N 间图.与图1_1-1比较.滤波状态 
更平滑.预测误差似乎很稳定地分布在0的附近.并且以 1) 为屮心 . 这些预测误差 
都是样本外向前一步预测误差. 
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100 


天 


2(MI 


： i(HI 


(b) ffl 测误差 



m 11-2 基于局部趋势状态空间模型，将_尔曼滤波应用与 Alcoa 股票日对数已实现波动 

韦时所得到的时间序列图： （a) 滤波状态 U( , ( ; (b ) 向前1步饱测误差^ 


11.1.3 预测误差的性质 

向前一步预测误差{%}在很多应用中都很有用，因此它们的性质值得我们仔 
细研究.给定初始值 S 1|() 和(这些值弓 : V £ 独立)，卡尔曼滤波使得我们可以递归 
地计算％这里^是 {?/,, • , y t ) 的线性函数.具体地说.通过重复替代，我们有 

Vi=Vi - / Ji | o , 

^2 — J/2 — "2|1 — 1)2 - fH\0 - ^l{Vl ~ "1|0 )， 

V3=}J3 - "3|2 = 2/3 - "1|0 _ A'2(J/2 — AM|0) - /^l(l — A*2)(J/l — "1|0 )， 

等等，此变换可以写成如下矩阵形式 

v = K(y - /ii| 0 lr), (11.13) 

其中 v = ( vi , •• - , v T y , y = ( yi , …，奸)'，是了维单位向量 ./ C 是下三角矩阵， 
且定义 如下： 

1 0 0 … 0 

A ?2 i 1 0 • • • 0 

K = I hj2 1 0 

# « « 

• « • 

• « « 

L 釦 T 1 ^ T 2 1 

其中 1 = — A " i-i 且 = _ (1 _ A 、— i)(l — fCi - 2 ) … （1 — Kj + i ) Kj(i = 2, … , T , 
j = 1，… , i -2). 需要说明的是，从定义上看，卡尔曼增益^既不依赖于 u 1|() 也 
不依赖于 { yi ， …, j / t }, 而是依赖于 I ^ io , 4和 < rj . 


(a) 滤波状态变疑 
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(11-13) 式的变换有一些重要推论.首先 {〜} 在正态假设条件下是彼此独立的. 
为了说明这点，考虑数据的联合概率密度函数 

T 

p ( y ，… iVt ) = p ( i / i ) (妁内- 1 ). 

3=2 

(11.13) 式指出从沾到 A 的变换是一个单位 Jacobian 矩阵，因此有 p ( v ) = p ( y ). 
再者，只要 u 训 给定，则 ^1)=^!). 因此，《的联合概率密度函数是 

T T T 

pi v ) = v(y) = = = 

j = 2 j i =2 

上式说明{叫}是彼此独立的. 

其次，卡尔曼滤波给出了 y 的协方差矩阵的一个 Cholesky 分解.为了说明这 
点，设 H = Cov ( j /). 从 (11.13) 式可知 Cov ( v ) = KftK ', 此外， {〜} 彼此独立且有 
Var ( v t ) = V t . 因此 Ki\K = diag { VV " , V T h 这正是 ft 的一个 Cholesky 分解. 
矩阵 A ： 的元素有一个很好的解释.参见第10章. 

状态误差的递归 

再看状态变量 u t 的佔计误差.定义 

Xt = Ht — /ie|e-i 

为状态变量 W 在给定 F t _: 条件下的预测误差.由 U .1.1 节可知， Var (^| F f _ 1 ) = 
由 (11.12) 式的卡尔曼滤波，我们有 

v t - yt — fH +t ： t— + e t ， 

和 

= ^ t+i — Pt+'.it = + Vi . — + f ^ tVt ) 

=+ r /, — K t v t = x t + T} t - K,{xi + e f ) = L t x t + r} t - K t e t , 

其中 L t = 1 K t = 1 E t | t _ x / V ； = ( V t - T , t ] t _ x )/ V t - al / V t . 因此对于状态误差, 
我们有 

灼一 xc 十 e t ， x t+ i = L t x t + n t — K t e t , t = l t …， T , (11.14) 

其中有 A =： w - u 110 . (11.14) 式是带有状态 变量心 和观测值 ^ 的时变状态空间 
模型 • 

11.1.4 状态平滑 

下面，我们考虑状态变量 （ Wl ，…， Wr ) 在给定数据 F r 和模型时的估计.即，给 
定 (11.1) 式和 (11.2) 式的状态空间模型，对所有时间 t ， 我们希望得到条件分布 
u t \ F T . 为此，我们首先回顾一下该模型所包含的一些事实. 
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• 所有涉及到的分布都是正态的，当 f <： T 时,我们可以将 w 在给定6条件下 
的条件分布写作 AT ( u t | r ,^ | r ). 我们称 u , | T 为 f 时刻的平滑状态 (smoothed 
state ) 而 E t |r 称为平滑狀态方差 (smoothed state variance ). 

•由 11.1.3 节中 { r ,} 的性质可知, {/-,.••• ,Vt} 彼此独立且为{奶，… ，|/ t } 的 
线性函数. 

• 如果 yi , …，是确定的，则 Fm 和{叫,… , v T } 都是确定的，反之亦然 
• {” t ，… ， i ， r } 和是独立的且均值为0,方差为 VarCt . j ) = Vj(j > t). 

对于 , v r } 在给定 F t _, 条件下的条件联合分布应用定理11.1(3)， 
我们有 

H , lT = E { f . L t \ F T ) = •• - , v T ) 

= E (/ it | F ,_ i ) + Cov [/ i t ，（ v “". , v T )’]Cov [(奶 ，…，时) ’ 】 _1 ( 价， … ,Vt)' 


Cov(// t ,Vi) 


'V t 0 … 0 

一 * 

vt 

Cov(/i t ， "m) 


0 Vi+i … 0 


v t ^i 

. Cov{pi t ,v T ) 


0 0 • • • vv 


Vj* 


= + ^2 Covint , Vj)V ~ 1 Vj . (11.15) 

J=t 

从 { t ， t } 的定义和独立性可知， Cov ( u t , t ; 7 ) = Cov(x t ,Vj)(j = 1, …， T ), 且 
Cov{xt,v t ) = = Var(x t ) = 2^| 卜 1 ， 

Cov(x t ,v t +i) = E[x t {x i+ \ +e t+1 )] = E[x t (L t xt + Vt - K t e t )\ = L t . 

类似地，我们有 

Cov(x t ，Vt 十 2) = E[ar ( (xt +2 + e t+2 )] ==-•• = T. t]t _ l L l L t ^, 


T- 


Cov ( x ,, v T ) = ^\ x t { x T + e r )]= … = E , u _, JJ Lj . 


因此， (11.15) 式变为 


^ t\T — + 十 l 二 + 


其中 
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<7^ 




是新息 ft ； l ， •• - , V T } 的加权线性组合.该权重和满足 


r T-l 


Vj ^ 

Vt 


(11.16) 





/ r-i \ 

~ 

(h-i=y t ^L, 

1 々十 1 

+ Lt + 1 ^ + ... + 

n ^ 

V = *+i / 

vt 

Vr 


+ Ltqt. 


因此.利用初始值奸 -(). 我们得到向后的递归 


qt -\ 


Vt ^ , 

v t ^ Ltqt ' 


t = T 、丁 一 1, • • • , 1 • 


(11.17) 


综合考虑 (11.15) (11.17) .我们得到一个计算平滑状态变量的向后递归 算法： 

7/-1 = + L t q t , ； ii|r = + t = T \ …，1， (11.18) 

其中 g r = 0, 且 u t \ t -u E t | t - i 和心由 (11.12) 式中的卡尔曼滤波给出. 

平滑状态方差 

平滑状态变量的力差 u <| T 可以通过定理 11.1(4) 用相似的方式推导 出来. 具体 
地，令 t ^={ 灼， •••， Ur K , 则我们有 

^t\T — Vm-(/zi| Ft) = Vai (fx t I F<_ i, vt, •• • ,vr) 

= Var (^ t | F t _!) - Co 如 ,( vT WCovKvr ) 广 1 Cov [/^，( v 「)] 

T 

= E <| t-i - X ^ l Cov ("… )卩[ _1 ， （11.19) 

i-t 

其中 Cov ( w #，》， j ) = Cov ^. b ) 如先前 (11.15) 式后给出的.因此 


E 


t| T = St, t _ 1 L'f— - |^n 

三 — (11.20) 


其中 


Mt ~ x= ^ + ^v^77 +L < L ^* vtt + *" + ( n L ? 


V ； +2 


Vt 
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是时刻/ - I 后向前1步预测误差方差倒数的加权线性组合.因为得不到时刻 T 后 
向前 1 步误差,所以令 Mt = 0. 统计量具有形式 

=+ ^iMty < = T , T — l ,--* ,1. 

由 (11.16) 式和 { v t } 的独立性.我们有 

Var^-O = 長 + + …+ ( 豆 0) 士 = h 

综合考虑上述结果，平滑状态变量的方差很容易通过向后回归计算出来 

Af#_i = V ；' 1 + LfM t , St|T = - < = T , ••- , 1, (11.21) 

其中 A/t = ◦. 

例 11.1( 续） 利用给 Alcoa 股票的日已实现波动率所拟合的状态空间模型.将卡 
尔曼滤波和 (11-18) 式与 (11.21) 式的状态平滑算法应用于其中.我们很容易计算 
出滤波状态平滑状态 u t | T 和它们的方差.图 11-3 给出了滤波状态变量和它 
的置信水平为95%的逐点置信区间的时间图，而图 U -4 给出了平滑状态变量和它 
的置信水平为95%的逐点置信区间的时间图.如所料想.平滑状态变量比滤波状态 
变量要平滑一些.平滑状态变量的置信区间也比滤波状态变量的置信 K 间窄.值得 
注意的是，的95%的置信区间的宽度依赖于初始值 Eno . 



m 11-3 基于给 Alcoa 股票收益的日对数己实现波动宇•所拟合的局部状态空间模型，给出 
滤波状态变量 u f | , 和它的置信水平为95%的逐点置信区间 
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图11~4基于给 Alcoa 股票收益的日对数已实现波动率所拟合的局部状态空间模型，给出 
平滑状态变量 《 t | T 和它的置信水平为95%的逐点1：信区间 

11.1.5 缺失值 

状态空间模型的优势在干处理缺 失值. 假设观测值是缺失的（/ 1 彡1 
且1 < £ < r ). 在状态空间的公式里有好几种处理缺失值的方法.我们考虑其中一 
种方法使得原始的时间刻度和模型形式保持不变.对于 < e 以十1，...，€ + "}.根据 
( II . 2 )式，可以表 示为叫 +1 和的线性组合来表达.具体地， 

= 辦 -1 + 屮 -1 — • • • = y+l + ^ T]j, 

i=<+i 

其巾，如果求和式的下界比上界还大则该求和式为 o . 因此对于 t e p + i ，... ， i - i - h }, 

= E ^ it \ Ft ) = 

VyrOI^Ft-i) — Var(/ij|/ r )r) = + (<_£— 1)(7^. 

所以，对于 f = £ + 2,... ，£ + &我们有 

M 中 -1 = A|t-i = + 4 ， (11.22) 

这些结果表明，当 < =名+ 1,".彳 +/,. 时，我们可以继续利用 （11.12) 式的卡尔曼滤 
波算法，此时 v t = 0, K t =0. 这是很自然的，因为当价缺失时.将没有新的新息或 
者新的卡尔曼增益，因此有％ = 0和 A： t = 0 . 

H 1. fi 初始化效应 

本小节将考虑初始条件化〜 N ( u ,| 0 ,5： 1|0 ) 对卡尔曼滤波和平滑状态的影响. 
由 （11.12) 式的卡尔曼滤波 


v i = yi - "i|o» V\ - ^1| 0 + 
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且由 （11.8) (11 11) 式， 


Eno 

02|1 = m|0 + -T7-V\ 


V ! 


# i|n + 


Ei 


Eqo + a 


(Vi — ^ i \ o )^ 


S211 = Si|o ( 1 


E , 


^ l |0 + °c 


+ 


S , 


^ l |0 + 




因此，设 S 1|0 增大到无穷，我们有 W 2|1 =讥且 E 211 = 4 +#• 这等价于将扒看 
作不变，且假定 W 〜 iV ( ?/ ll ^). 在文献中，这种初始化卡尔曼滤波的方法叫做扩散 
初始化 (diffuse initialization ), 因为 S^n 取值很大意味着初始条件的不确定 • 

下面，再看扩散初始化对状态平滑的影响.很显然，基于卡尔曼滤波的结果，状 
态平滑不受扩散初始化的影响 （< = T ，...，2). 因此，我们主要讨论给定 Ft 条件下 
的 Wl .由 (11.18) 式和 — 1 - A = V - 1 ^ 的定义，我们有 


^\\T — Ml|0 + ^i|o9o 


/乂1|0十乙 1|0 




0 


E 


1|0 


"1|0十 ~~十4奶). 


Ls 1|0 +d s 1|0 + 4 

^1|0 + 

设 El | 0 — > 00 , 我们有 wi|T = « i|o + T； i + = !/i 十进 一 步，由 （11.21) 式 ，并 

利用 VI = Eqo + 我们有 

2 


S；|T = ^!| 0 — 


1 


E 


1|0 


0 


^1|0 + ^ 
^1|0 


0 


E 


1|0 


Sl |0 + 


) 


Mi 


Ei,o + crj 


)~( l ~ s ^ T ^ f ) E? '° Ml 


( s ^ f ) -(: 


Si 


S „ o +^ 


a A r M x . 


因此.令 S M0 — oc ， 我们得到 E 11T = rT c 2 - at My . 

基于上述讨论，我们建议在对初始值 u , 了解较少的情况下利用扩散初始化. 
然而，在实际应用中，可能很难判断马随机变量具有无限方差时使用此方法的可行 
性.如果有必要，可以将〜看作状态空间模型的附加参数，并可与其他参数一起估 
计出来.后一种方法和第2章与第 8 章的精确最大似然估计密切相关. 

11.1.7 估计 

本小节将考虑由 (11.1) 式和 (11-2) 式给出的局部趋势模型中〜和％的估计. 
基于 11.1.3 节所讨论的预测误差的性质，卡尔曼滤波给出了计算数据最大似然函 
数的一个有效的方法.具 体地， 正态假设下的似然函数为 
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咖 ， … ， yrW^(fri) = p{y\\a e ,a 7} ) fJ(yt|^i_i,<T e ,a r/ ) 

t=2 

T 

= p(y i k e ，％ ) II ㈣ 巧 — i ， 〜 ， a ”) ， 
e=2 

其中扒〜 Ar ( Wl | o , Ki ) J . v t = (?" — %<<)〜 N{0,V t ). 因此，若假定 U 1K , 和 E ” 0 已 
知并取其对数，我们有 

7 1 

hx[L(a e ,(r v )} =-- ln (2 jt ) -去亡 ( ln ( Vi ) + 普), (11.23) 

上式包含％和 K t . 因此，包括缺失值在内的对数似然函数，可以通过卡尔曼滤波 
递归地计算出来.许多软件包比如 Matlab , RATS 和 S-PIus 等都可以通过卡尔 
曼滤波法则进行状态空间模型的估计.本章中，我们利用 Koopman , Shephard 和 
Dooruik (1999) 开发的 SsfPack 程序， S-Plus 与 OX 都包含该程序. SsfPacfc 和 
OX 可以从它们的网页上免费下载. 

11.1.8 所用的 S-Plus 命令 

这里我们给出对 Alcoa 股票收益率的日已实现波动率进行分析的 S . s / 尸 adfc 命 
令，并给出简要的 说明. 对于所用命令的详细细节，可以参考 Durbin and Koop - 
mnn ( 2 001， 6 . 6 节). S - Plus 使用特定的符号来指定状态空间模型，参见表 11—1 .这 
些符号必须完整无误.在表 II - 2 中，我们给出了一些命令和它们的功能. 


表 n-i 状态空间形式和 s-pius 中的符号状态空间参数 


状态空间参数 

S-Plus 名 

6 

mDelta 


mPhl 

n 

mChnega 

£ 

mSigma 

表 11-2 

Saf Pack 包的一些命令 

命 令 

功 能 

SsfFit 

最大似然佔计 

CheckSsf 

在 S-Plus 中创建对象 * *Ssf ，》 

KalmanFil 

KaXmanSmo 

执行卡尔曼滤波 

执七状态平滑 

SsfMoraentEst with ta«k ‘ *STFIL" 

计算滤波状态及方差 

SsfMoentEst with task * * STSMO 1 * 

计饵平滑状态及其方差 

SafCondDens with la»k “STSMO" 

计算不带方差的 T 滑状态 


在我们的分析中，我们首先对 （11.1) 式和（1 〗 .2)式的状态空间模型进行最大 
似然估计，得到 rr e 和％的 估计. 初始值 E l|Q = -1 且 ti 1|Q = 0,这里“-1”表示扩 

散初始化，即， E 1|() 很大. 这时，我们把所拟合的模型看成是已知的，然后进行卡尔 
曼滤波和状态平滑. 
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状态空间模型的 SsfPack 命令和 S-Plus 命令 

> da = matrix (scan (file=, aa-rv-0；304 .tixt:,) ,2> % load data 

> y = log (da [1,” ％ log (RV) 

> ltm.start=c(3 # l) % Initial parameter values 

> pi = -l % Initialization of Kalman filter 

> = 0 

> ltm.m«function(parm){ % Specify a function for the 

+ sigma•eta=parm[1] % local trend model. 

•f sigma.e=parm [2] 

+ ssf.m=list(mPhi=as.matrix(c(l,1)) # 

+ mOmega=diag(c(sigma.eta A 2,sigma-e^2)), 

十 mSigma=as.matrix(c(Pl # al))) 

+ ChankSsf(ssf.m) 

% perform estimation 

> ltm.mle=SsfFit(ltm.start,y,"ltm.m",lower=c(0,0), 

+ upper=c(100,100}) 

> ltm.mle$parameters 

[1] 0.07350827 0.48026284 

> sigma.eta=ltm.mle$parameter[1] 

> sigma.eta 

[1] 0.07350827 

> sigma.e=ltm.rale$parameters[2] 

> sigma.e 

[1] 0.4802628 

% Specify a state-space model in S-Plus. 

> ssf.ltm.list=list(mPhi=as.matrix(c(l,l)), 

+ mOmegoi=cliag (c (sigma . eta"^2 , sigma . e 2)), 

+ mSigma=as.matrix(c(PI,al))) 

% check validity of the specified model. 

> ssf.ltm=CheckSsf(ssf.ltm.list) 

> ssf.ltm 
$mPhi : 

[,l] 

ClJ 1 

[2,] 1 

$mOmega : 

t,l] [,2] 

[1,] 0.0054035 0.0000000 

[2,] 0.0000000 0.2306524 
$mSigma : 

t,l] 
tlj -1 
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[ 2 ,] 0 

$mDelta : 

[, 1 ] 

[1J 0 

[ 2 ,] 0 

$mJPhi : 

[ 1 ] 0 
$nuJOmega ： 

[ 1】0 
$mJDelta : 

[ 1 ] 0 
$mx ： 

[ 1 ] 0 
$cT ： 

[ 1 ] 0 

5CX ： 

[1] o 

$cY ： 

[ 1】1 
$cSt : 

[ 1 ] 1 

attr(, "class") : 
[1 】 " ecf" 


' loglike" 
’task" 


% Apply Kalman filtpr 

> KalmanFil.ltm=KalmanFil(y,ssf.ltm,task="STFIL 1 

> names(KalmanFil.ltm) 

[l] "mOut" "innov" "std.innov" "mGain" 

[6] "loglike.cone" "dVar" "mEst" "mOftP" 

[11] "err" "call" 

> par(mfcol=c(2,1)) % Obtain plot 

> plot(1 ： 340,KalmanFil.1tm$mEst[,1],xlab= , day , , 

+ ylab= f filtered state*,type= , 1 f ) 

> title(main:’ （ a) Filtered state variable ，） 

> plot (1 : 340 , Ka 1 manFi 1.1 tm$mOut [, 1] , xlab-^ay* , 

+ ylab=*v<t)*,type= , l») 

> title{mainr ， {b) Prediction error*) 

% Obtain residuals and their variances 

> KalmanSmo.ltm=KalmanSmo(KalmanFil.ltm,ssf.ltm) 

> names(KalmanSmo.ltm) 

[l] state . residuals" " response . residuals " "state .variance' 
[4 】 "response.variance" "aux.residuals" "scores" 

[7] "call" 

% Next, filtered states 

> FiledEst.ltm=SsfMomentEah(y,ssf.ltm,task= n STFIL") 

> names(FiledEst.ltm) 

[1J "state.moment" "state.variance" "response.moment" 

【 4] "response.variance" "task" 
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% Smoothed states 

> SmoedEst. ltm=SsfMoir.entEst (y # ssf • ltm, task= "STSMO" } 

> nameG(SmoedEst.ltm) 

【 1] "state •moment:" "state .variance" n response .moment M 

[4] "response.variance" M task" 

% Obtain plots of filtered and smoothed states with 95% C.I. 

> up=FiledEst.1tm$state.moment + 

+ 2*sqrt (FiledEst. ltm$st:ate .variance) 

> lw=FiledEst.ltm$state.moment - 

♦ 2*sqrt(FiledEst.ltm$statc•variance) 

> par(mfcol=c(1,1)) 

> plot (1:340, FiledEst • ltni$stat:e • moment, type= , xlab=, day 、 

+ ylab=’value 、 ylim=c (-0.1,2 . b)) 

> lines(1:340,up,lty=2> 

> lines(1:340,lw,lty=2) 

> title(main= # Filed state variable 1 ) 

> up=SmoedEst.ltm$stace.moment + 

+ 2*sqrt (55moedEst. ltm$state .variance) 

> lw^SnioedEst: • ltm$state • moment - 

+ 2*sqrt(SmoedEst.itm$state.variance) 

> plot(1:340,SmoedEst.ltm$state.moment,type= # 1 # ,xlab= # day' # 

♦ ylab* # value 9 , ylim=c(-0.1 f 2.5)) 

> lines(1:340,up,lty=2) 

> lines(1:340,lw,lty=2) 

> title(main= # Smoothed state variable ’） 

% Model checking 

> resi=KalmanFil.Itm$m0ut[,1]*sqrt(KalmanFil.ltm$mOut[,3]) 

> archTest(resi) 

> autocorTest(resi) 

对于 Alcoa 股票收益的日已实现波动率，基十残差分析.局部趋势模型是充分 
的.具体地，对于给定的参数估计，利用卡尔曼滤波得到向前1步预测误差叫和 
它的方差然后计算标准预测误差力 t = Vt / y / Vu 并检查序列相关性和 {「 V } 的 
ARCH 效应.我们发现对于标准预测误差有 Q (25)=23.37(0.56) 且检验 ARCH 效应 
的延迟为25的 LM 检验统计量是 18.48(0.82), 其中括号里的数字表示 P 值‘ 

11.2 线性状态空间模型 

现在我们考虑广义的状态空间模型_许多经济和金融上的动态时间序列模型 
可以表示成状态空间模型的形式，例如 ARIMA 模型、带有不可观测元素的动态线 
性模型，时变回归模型和随机波动率模型.广义高斯线性状态空间模型具有如下形 
式 

st+i = + TtSt 4 - RiJh ， (11.24) 

y t = c t + Z t s t + e t , (11.25) 

其中 = ( su ’."， s m t )’ 是维状态向量， = ( yu ， …是知维观测向量， 4 




和 G 分别是 m 维和I，维的确定性向量， T , 和&分别是 m x m 和 A: X m 的系数 
矩阵，风是 m x r». 矩阵. 通常由 m x m 单位矩阵的子列构成，且和 { et} 分 
别是 n 维和 A： 维高斯白噪声序列满足 


ri t ^ N {0, Q t ), e< 〜 7 V(0, i^)， 

贫中 Q , 和 f /, 是正定矩阵.我们假定{%}和 【 c t } 是独立的，但是在必要的时候 
这个条件可以放松，初始状态力服从 W(u 1|0 .I： 1|0 )， 其中 Ul| ◦和 E 110 是给定的, 
且对于 f > 0, e t ^ rf t 独立. 

(11.2 5 ) 式是 度量或 者观測 方程. 该方程给出了观测值的与状态向量、解释 
变量 Q 和测量误差的联系. (11.24) 式是状态或转移 力程. 它描述的是带有新息 
%的一阶马尔科 夫链. 该马尔科夫链决定了状态的转移.矩阵7\, _R t ， &和 
都己知且称其为系统 矩阵. 这些矩阵通常是稀疏的.它们是某个参数0的函数 
且参数0可以通过最大似然方法估计. 

(11. 2 4)式和 (11.25) 式的状态空间模型可以被改写成如下更紧凑的形式 


; ^tot + ut 


(11.26) 


其中 


， A 


X 

. e l 


而且 {u,} 是高斯白噪声序列，其均值为0、协方差矩阵力 

o — 0 


= Cov(l£ < ) — 


0 H t 


扩散初始化可以通过 

Sj|q — S, -f- AS.X,, 

得到•其中 E* 和是 mx m 的对称正定矩阵，丑 A 为大的实数，可以取到无限. 
在 S-Plus 和 SsfPack 中 ,使用符号 


参见表 11-1. 

在许多应用中，系统矩阵不随时间而变然而，这些矩阵也可以是时变的这使 
得状态空间模型更加灵活. 


11.3 模型转换 

为了领略状态空间模型的灵活性，我们将一些著名的经济和金融模型写成状态 
空间模型的形式. 
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11.3.1 带时变系数的 CAPM 

首先.考虑带时变截距和斜率的资本资产定价模型 (CAPM). 该模型为 

r t = a t + e t , e t 〜 TVXO ，^^)， 

a t+ i =Qt + r / t , Tf t ~ iV (0, cr 2), (11.27) 

(3 t+ i=/3 t +e u Q 〜 ； V(0,af), 


其中 r t 为某项资产的超额收益 .r M , t 是市场超额收益，且新息 { e t , Vt , e t } 是彼此独 
立的.该 CAPM 里面的参数《和以随机游动的形式随时间 变化. 我们可以很容 


易地将模型改写为 



因此，时问序列 CAPM 模型是状态空间模型的•个特例，其中〜 一 {ct t ,/3 t y, T t = 
R, = i 2 是 ‘2 x 2 单位矩阵， = 0, c t = 0, Z , = ( l , rAf , t ), K t = g 且 Q ,= 
ciiag { cr ^，( rf }• 进一步，由 （11.26) 式我们有 = 0， u t = ( z / t , e t ) / , 



如果利用扩散初始化，则 

-1 0 
S = 0-1 

0 0 

时变序列模型的 Ssf Pack/S-Plus 命令详述 

对于 (11.27) 式的 CAPM, 中,包含 rw . t , 且是时 变的在 SsfPack 里指 
定这样的模型需要一些特殊的输入.起码它需要两个附加变量： （a ) 存储的数 
据矩阵X; (b) 识别数据矩阵和 Z, 的指标矩阵.表 11-3 给出了 (11.26) 式中状态 



表 11-3 Ssf Pack/S-PU ih 中关干时变状态空间槿型的符号及命名 


指标矩阵 Ssf Pack/&-Ph\n 中的命名 



时变败据矩阵 


mJDelta 
mJPhi 
mJOmega 


SsfPack/S-FXus 中的命名 
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空巧模型的指标矩阵的符号.注意，矩阵必须和 矩阵屯 有相同的维数.在 ./+ 
的元素中，除非与它相对应的屯的元素是时变的，否则都设定为 “-1”.. 心的非 
负指标表明数据矩阵久对应的列包含时变值. 

作为说明，考虑第9章中1⑽0年丨月至2003年I 2 月的 General Motors 股票 
的月简单超额收益率- S&P 500复合指数的月超额收益率作为市场收益率.指定一 
个时变 CAPM 需要方差兮4和4的值，这里假定（々，〜，〜）= (0.02,0.04, 0.1). 
下面的命令给出了如何在 SsfPack / S - P \ uB 中为时变 CAPM 指定一个状况空间 
模型： 

> X .mtx=cbind( 1 # sp) % Here 、 sp, is the market excess returns. 

> Phi.t = rbind(diag (2) f rep(0,2)) 

> Sigma=-Phi.t 

> sigma.eta=.02 

> sigma.ep=.04 

> sigma..1 

> Omega=diag(c(sigma.eta,sigma.ep A 2,sigma.e A 2)) 

> JPhi = matrix(-l,3,2) % Create a 3-by-2 matrix of -1. 

> JPhi [3,1] *1 

> JPhi[3,2】=2 

> ssf.tv.capm=list(mPhi=Phi.t, 

+ m0mega=0mega # 

♦ mJPhi=JPhi # 

+ mSigma=Sigma, 

+ mX^X.mtx) 

> ssf.tv,capm 
$mPhi : 

r.u r, 2 i 

【1,】 1 0 

【2,】 0 1 

13 0 ) 0 0 

$mOmega : 

[,1 】 [, 2 ] [,3 】 

[1J 4e-04 0.0000 0.00 
[2,] Oe 十 00 0.0016 0.00 
[3,] 0e+00 0.0000 0.01 
SmJPhi : 


]1 1 
2 I ■ 


2 


1 J 

2 


1 J u s 

# # # m 
12 3$ 

fL rl rl 


TJ 1J TJ ^ 

12 3 5 

rL rl rl 
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numeric matrix ： 168 rows, 2 columns. 
sp 

[1,】1 -0.075187 
【 168,】 1 0.05002 

11.3.2 ARMA 模型 

考虑第 2 章中均值为 0 的 ARMA ( p , g ) 过程 i / t , 

< t >{ B ) y t = 0 { B ) a u 叫〜 （11.28) 

其中 0( B ) = 1- f ： ct > iB \ 6 ( B ) = l~i 且 p 和为非负 整数. 有许多方法 

可以将这样一个 ARMA 模型转化为空间模型的 形式. 我们讨论文献中已有的 
三 种方法.令 m = max ( p , <7 + 1) 且将 （11.28) 式中的 ARMA 模型重新改写为 

m m — 1 

yt = ^ ^ (t^iUt—i + 0 ^ — > : ( 11 . 29 ) 

t=i j=i 

其中 = 0 (i > p ) 9 j = 0 (j > q ). 特别地， = 0( 因为 m > g ). 

Akaike 方法 

Akaike (1975) 将状态 向量〜 定义为包含在预测原 点 （ 进行预测所需要的所有 
信息的变量的最小集合.对于 （11.28) 式中的 ARMA 过程，有 m = max ( p ,</ + 1), 
s t = ( yt \ t , yt + i \ u -'' ， yt + m - i | t )'， 其中 Vt + i\t = E ( yt + jl ^ t ) 是给定 6 = {奶，… ， j / t } 
条件下价的条件期望. 因为糾 t = i / t ， 故〜的第一个元素就是 y t . 从而观测方 
程为 

yt = Zs t , (11.30) 

其中 Z = ( l ,0，...，0) lxm . 通过以下几步推导可以得出转移方程.首先，由定义 

Si ， t+1 = yt+i = Vt+\\t + (j/e+i — l/t-Hit) = s 2t -f 0*11, (11-31) 

其中是的第 i 个元素.其次.考虑第 2 章给出的 ARMA 模型的 MA 表示, 

也就是 « 

yt = a t + 必 iOt-i + iha t -2 + …= 52 也 0 

»=0 

其中咖=1且岭的其他权重可以通过计算1 + g ^ = 0( 丑 )/0(5) 中 R 的系 

数得到.特别地，我们有 ，_1 

= 泠 1 — 汐 1 ， 

少 2 = 01^1 + 如一设 2, 
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咖 V’m 2 + 3 + . . * + + X — 沒 m-1 


m - ] 


— 沒 m -1. 


利用 MA 表示，对于 j > (), 我们有 


/ L»J 


= E ( y f + J | F t ) = E f j | F t 

\<t=0 

=at + ip j+ ia t -i + tp j+ 2a t -2 + 


和 


•Vt 十 j|t 十 l = E (Vi 十 j|F <. 十 l) = rpj-ia t+ i + ipja t I %+irtt-i 十 

=^j-iat+1 十 m+jlt. 

因此对于 j > 0 我们有 


(11.32) 


% 七 |* 十 i = Vt+j\t 4- 少 (11.33) 
该结果称为 ARMA 模型的预测更新公式.若 : Vt +1 可以得到，该方法给出，一个简 
单的更新预测的方法.即预测原点从 f 变化到 i +1. ^ +1 的新信息包含于新息 Ot +1 
中，基于该新信息及权重処 — 修止预测原点为/时刻的预测，并计算预测原点为 
(力+1)时刻的预测. 

最后，由 (11.29) 式并利用 E ( a t+i | F t+l ) = 0 (j > 1), 我们有 

m 

Vt-Hn t+l — ^iVt+m-Ht+l ~ 

<=1 

由 （11.33) 式.前面的等式变为 


m- 


i=l 

m /m-1 、 

> : 也 //t+m - i|t + ( ^ : 1-’ 一 1 J 1 

t=l \ i=l J 


m 


— 〉 : 0sWt+m—i|t + VVn l ； 


i=t 


(11.34) 


最后一个等式运用了 (11.32) 式.对于 j = 2 ，... ， m _ 1，联合 （ 11.31) 式、 （ 11.33) 式 
(其中 j =2,…， m - 1) 和 (11.34) 式，我们有 


!/t+i 


yt+2|t+i 


: S/t+m-lU+l 





0 

0 


1 

0 


0 0 
.诊 m 必 m- 


0 

1 

0 


0 

0 


4>i 



yt 


1 



+ 





必 m-2 

j 

jUt-j-rn l|f_ 


. J /’m 1 . 


rt<4-i • (11.35) 
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因此， Akaike 方法的转移方程为 

s t+ i = Ts t + Rr } t , Vt .〜 N (0, ctI ), (11.36) 

其中 r /, 一 a f +1 , 且 T 和 7 Z 是 (11.35) 式中的系数矩阵. 

Harvey 方法 

Harv e y (1993, 4.4 节）给出了具有 m 维状态向 M &的状态空间 的一种 形式. 
该状态向量的第一个元 素是讲 ，即 s lt =价.〜的其他元素通过递归得到.由 
ARMA ( m , m - l ) 模型.我们有 

m m— 1 

Vt+i = 4>iVt + - 6j a t+i-j + a t+i 

»=2 j=l 

=<PlSit + S 2 t + ” t ， 

m m—1 w 

其中 S 2t = t E r/t — a t+ i 且如前述定义 — j / 卜考虑 

i =2 i=l 

«2, t + l , 我们有 

m m—1 

•，2, t+l = ( f > iyt +2 -i — 0 j at +2 - j 

t =2 i=l 

m m — 1 

= <f>2Vt + 十 2 — i 一 十 2- j — 沒 十 1 

i =3 j =2 

= < f >2 Su + S 3 t -\-(- ei ) rit , 

m m—1 

其中烈纟 =£ — ^2 心 a t +2- jf ， 下一步，考虑我们有 

<=3 j -2 

m m— 1 

•，: M+i = 5^0 iyi +3 -t - 

i =3 j =2 

m m—1 

= <hyt + ^2 中 iVt 十 3-i - 5 Z ^J a *+3-j + (-〜)at+l 
t=4 j=S 

三 伞 3SU +«4< + (~02)Vt, 

m m — 1 

其中 = 亡 < Pilh 十 3 — i — Y 1 Gj a t 十 3- J . 重复上述 过程， 可以得到 

i=4 jf=3 

m m —1 

= > : 1—i 一 / : —1—j ~ ^mUt—X 一 ^m—X^t • 

i=m i = m — 1 

最终有 

沒 m』+l = ^mVi — 沒 m — 1〜+1 = 0m$n 十（ — 汐 m —l)"t. 
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将上述方程综合起来，我们得到如下形式的状态宇间 模型: 


st+i = + Rvt, Vt ~ ^ V (0, aj ), (11.37) 

yt = Zs t , (11.38) 

其中的系统矩阵不随时间变化且定义为 Z = (1,0,*.. ,0 ) lxmi 



<t>\ 

l 

0 • • ， 

0 • 


1 


02 

0 

1 

0 


1 







一沒 1 

T = 

• 



\ 

， /I = 



0m — 1 

0 

0 • • • 

1 


• 







9ffl 一 1 


0m 

0 

0 … 

0 - 




且必， c t 和都是零. （ 11.37) 式和 （ 11.38) 式的模型没有测量误差.它的一个优 
点是 AR 和 MA 系数被直接用在了系统矩阵里. 

Aoki 方法 


Aoki (1987, 第4章）讨论了将一个 ARMA 模型转化为状态空间模塑的几种 
方法.首先，考虑 MA 模型.即讲= 0{ D ) a t . 在此种情况下，我们可以简单定义 
s t = ( a t q , n t 1 ) t ,并得到状态空间模型形式为 


a *-g+l 


■010... 0 " 


^•i—q 




a t-q+2 


0 0 1 0 


a 卜 g +l 


0 


• 

= 

• • 

• • 



+ 


a#. 

a t-i 


0 0 0 1 


at-2 


0 


■ a t . 


0 0 0 … 0 


• a t，l - 


1 



Vt =(一心， 一 心-1， ... ， 一沒 1) 〜+ at , (11.39) 

注意，在这种特殊情况下， a t 同时出现在状态方程和测量方程中. 

其次，考虑 AR 模型，也就是说 4>{ D ) z t = a t . Aoki(1987) 介绍了两种方法.第 
一种方法直接定义= ( zt - p + i ,-.. , Zt y , 得到 




0 

1 

0 

Zt-p^3 


0 

0 

1 

2t+2 > 


0 

0 

0 

. z t+l . 


• <h 

0p—1 

0p-2 


zt = (0,0, ••- ,0, l ) s t . 


0 

0 


1 

01 - 



A—P+1 


' o ' 





0 



: 

+ 


a t 十 1 ， 


Zt-hl 


0 



. 艺 t . 


_ 1 , 



(11.40) 
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第二种方法中定义状态向量的方式与第一种方法一样，只是从最后一个分量里去除 
I' at ； 也就是说，如果 p = 1 ， 则 s* = zt-a*; 如果 p > 1 ， 则 fl* = (2 t — p+u … ♦ 之卜 1 ， — 
a ， t 简单的代数运算可以证明 


— |H*2 


0 1 0 -o' 


為 ― p 十 1 


0 



0 0 1 0 

• • 


之 t—p+2 

-|_ 

0 

Zt 


• • 

0 0 0 1 


^t-l 

i 

1 

• 心十 1 — 1 . 


-小 P 4>p-l 伞 P—2 • • 


• 一 a t • 


•彡 1 . 


= (0,()，..•，0, l ) st + a <. (11.41) 

a t 再一次同时出现在转移方程和测量方程中. 

下面考虑 ARMA(p, 9 ) 模型 4>( B ) y t = 9( D ) a t . 为简便，不妨设 q > p , 引入辅助 
变量為一 [ lAK ^ at , 则有 


= at, y t = 9(D)z t . 

因为 々是 AR(p) 模型，我们可以用 (11.40) 式和 (11.41) 式的转移 方程. 如果用 
(11.40) 式，我们可以利用 y t = 0(B)z t 建立如下测量 方程： 

Vt = (—4-1 ， -沒 p-2 , …， 一设 1 ， l)«t, (11.42) 

其中 p> q 且当 j>q 时有 & = 0. 另一方面，如果用 (11.41) 式的转移方程，我们 
可以建立如下测量 方程： 

Vt — —^p-2>... » — 没 1 ， l)«t + a t . (11.43) 

总之，一个 ARMA 模型可以有多种状态空间模型表示.每种表示方法都有 
其优缺点.可以选择这些表示方法中的任何一个来进行估计和预测从另一方面 
讲， (11.24) 式和 (11.25) 式的状态空间模型的系数不随时间变化.可以利用 Cayler- 
Hamilton 定理来证明观测％服从 ARMA(m,m) 模型，其中的 m 是状态向量的 
维数 


Ssf Puck 命令 

在 Ssf Pack / S - P\\xs 4*, 可以利用命令 GetSsf Arma 将 ARMA 模型转化为状态 
空间形式，所用方法为 Harvey 方法.为了进一步说明.考虑 AR (1) 模型 

yt. = H a t , a f ~ ^(0,0.4 2 ). 


该模型的状态空间模型为 
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11.3.3 线性回归模型 

客元线性回归模型也可以表示成状态空间的形式.考虑模咽 

y t =x' t ^ + e t , e t 〜； V(0,4 )， 

其中是 P 维解释变量而是一个 p 维的参数向量.对于所有的 t 令 s t = 0.这 
时模型可以写为 

[1 T ] 孙 + H . 

因此，系统矩阵为 T t = I p , Z t = x ' f , d t = 0, c f = 0, H t = 0 且 . 因为状态 
向量是固定的，所以应使用扩散初始化方法. 

我们可 以将回 归模型进行拓展使得 /3 t 为随机的，即 

= 沐 + RtVt，Vt 〜 ^(0,1)， 

且 _Rf = (< ri ， …, ( TpY , ai ^ 0. 如果 = 0，则不随时间变化. 

SsfPack 命令 

在 SsfPack 中， 命令 GetSsfReg 为多元线性回归模型创建了一个状态空间形 
式.命令有一个输入自变量.包含解释变量的数据矩阵.为了进一步说明，考虑简 
市场模型 

ft = 十点 irM , t + e t ，t = l ， …，168， 

其中 n 是某项资产的收益，而是市场收益（例如， S&P 500复合指数收益).状 
态空间形式可以通过如下命令获得. 

> ssf•reg 麵 GetSsfReg(cbind( 1, cp)) % 'op # io market return. 

> ssf.reg 
$mPhi : 

t,l] 1.2] 

tU 1 0 

【 2 ,】 0 1 

13, ] 0 0 

$mOmega : 

t.ll [,2] [,3] 

[1,】 000 

[ 2 ,] 000 

【 3,] 001 

$mSigma : 

t,l] [, 2 ] 

u.i -i o 

【2,] 0 -1 

U, J 0 0 

$mJPhi : 
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1,1】【，2] 

【1,】 -1 -1 

【2,】 -1 -1 

[3,] 1 2 

$inX: 

numeric matrix ： 168 rows, 2 columns. 
sp 

[1,] 1 -0.075187 
[168,】1 0.05002 

11.3.4 带 ARMA 误差的线性回归模型 

考虑带有 ARMA { p iq ) 误差的回归模型， 

Vt = + zt > ( p [ B ) z t = 6{ B ) a t , (11.45) 

其 中〜〜 ^(0,^) 且 々是 维解释变量.该模型的一种特殊情形是非零均值的 
ARMA ( p , q ) 模型，此时对子一切 <,而=1且0变成了纯量参数. 设〜是 2t 序 
列的一个状态 向量. 比如，如 (11.37) 式定义的那样.我们可以定义访的状态向量 
s ? 为 

S t = 1 (11.46) 

其中对于一切 t 有 (3 t = f 3 , 这时讲的状态空间形式为 

• s tfi = + R m r) tl (11.47) 

Vt = Z * t 8* t) (11.48) 

其中 — (1，0,… , 0, a ;{) lx ( m + fc j , rn = max ( p，g 十 1) 且 


W = 


其中的 r 和 H 由 (11.37) 式所 定义. 我们可以用如下紧凑的形式给出状态空间 
模型 

a eVil = rr*l r^el 

yt J — W # L 。 .. 

Ssf Pack 命令 

对于带有 ARMA 误差的线性回归模型， SsfPack 利用命令 GetSsfRegArma 建 
立其状态空间形式.可以用命令 args ( GetSsfRegArma ) 找到该命令的自变量，包括 
解释变量的数据矩阵和 ARMA 模型的 指定. 为了进一步说明.考虑模型 




Vt= Po + l3\Xt 4- 2t, t,= 1, ••- ,168, 
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测的不规 则项. 在文献中，通常用非平稳（可能带二重单位根）模型来描述趋势项: 


= ^ + Pt+Vu m ~ AT(0,^), 

其中川〜 tv ( o , o .Pi ~ mo . c 是一个较大的实数，比如《=10 8 .可参见，例如 
Kitagawa and Gersr . h (19 flfi ). 如果 ' = 0,则服从带漂移汍的随机游动.如果 
A = % = 0,则 "， 表示确定性的线性趋势. 

假定季节项7,具有如下形式 


(1+5 + ... +S a_1 ) 7 t =w*, uj t ~ N(0, ffj), (11.51) 

其中 s 是一年中季节的个数.也就是季节项的周期.如果= 0,则季节项就是确 
定的.假定循环项具有如下形式 

瓜 m 

^t+i 


cos ( Ac ) sin ( A c ) 
- sin ( A c ) cos ( A c ) 




et 


(11.52) 


其中 


e* 

e.*J 


N 


.— 6 2 )I 2 


： X7 0 〜 ； V (0, 〜 2 )， 却〜 AT(o ， d )， 且 Cov ( ro 0 , CT ；)) = n , ^ G ( 0 , 1 ] 为阻尼因子，且循环 
的频率是 = 2 jt / g ， 以 g 为周期.如果4=1，则循环变成确定性的正弦余弦波动. 


^.s/PacAr/S-plus 命令 


利用命令 GetSsfStsm 可以给结构时间序列模型建立一个状态空间形式.它允 
许有 10 个循环项.可以参看命令 args(GetSsfStsm) 的输出.表 11-4 给出了该模 
型自变量的一个概要及其相应的符号.为了进一步说明，考虑 （11.1) 式和 （11.2) 式 
的局部趋势模型,这里令 a e = 0. 4 , ％ = 0.2. 该模型是纯量不可观测项模型的一个 

特例.可以通过如下命令得到其状态空间形式. 

> ssf.stsm=GetSsfStsm(irregular=0.4,level=0.2) 

> ssf.stsm 
$mPhi : 

【•1】 

[ 1 ,] 1 
[ 2 ,] 1 
SmOmega : 

[,1】 1 . 2 ] 
tl,l 0.04 0.00 
[2, ] 0.00 0.16 
$mSigma : 

[, 1 ] 

[1 ,J -1 
[ 2,1 0 
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表 11-4 S»f Parfc/S-plus 中命令 GetSsfStsm 的自变翬 


自变 g STSM 参數 


irregular 

(Tn 

level 


slope 


seasonalDummy 


seasonalTrig 

泛 u/，a 

seasonalHs 

^W.9 

CycleO 

^C| 6 

Cycle9 

^ e i * o 


11.4 卡尔曼滤波和平滑 

本节将学习 （11.24) 式和 （11.25) 式中广义状态空间模型的卡尔曼滤波和各种 
T 滑方法.下面将按照 11.1 节里的步骤给出推导，对于只对应用感兴趣的读者，初 
次阅读时可以跳过此节.本节较好的一个参考竹是 Durbin and Koopmau ( 2 001， 第 
4章). 

11.4.1 卡尔曼滤波 

重新回顾一下卡尔曼滤波的 目的， 即递归地得到在给定数据 . y t ) 
条件下 s , +1 的条件分布和模型.因为所涉及的条件分布是正态的，因此只要研究 
其条件均值和条件协方差矩阵就足够了.令和 S 扑分别表示给定 E 条件下 ， 
s 3 的条件均值和条件协方差矩阵，也就是说 bjIF , - ATS 扑) .由 （11.2/1) 式 

= E ( d t + T t a t 4- Rtrj t ] Ft ) = d t + T t s t \ t , (11.53) 

S < + i|t = Vai ( T tSt + RtVt \ F t ) = T , S (| t T ； + R t Q t R ' t . (11.54) 

与 11.1 节相似，设 y t \ t . x 表示给定 尺 - i 条件下奶的条件均值.由 (11-25) 式得 

Vt \ t —\ — + ^ t a t \ t —\• 

令 

vt — y t - Vt \ t-i = Vt ~ ( c t + — z d s t - + e t ， （11.55) 

是 y , 在给定 F f _! 条件下的向前 1 步预测误差.很明显有 （ a ) E ( t ; t | F f _,) = 0; 
( b ) v t 和 F t -\ 是独立的.即对于1 < _/• < «， Cov ( v t , yj ) = 0； ( c ) { w t } 是一列独立的 
正态随机向量.令= Vm ( v t | fUi ) = Var ( t ; t ) 是向前1步预测误差的协方差矩 
阵•由（ II . 55 )式，可得 

V t — Var[Zt(st — s t |t—i) + et] = Zt^t\t-i^t + 丑 t. (11.56) 
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因为 K = {F < _ l ,yJ = {Fi-i.wJ, 应用定理 11.1 可以得到 

»t|t = E(a,|F t ) = E(«,|F ( _i, v t ) 

= E(s t |F t _ 1 ) + Cov(fi t , Ui)[Var(v t )]~ l i; t 
= l + (11.57) 

其中 C t = Cov(a t , 由下式给出 

c t = Cov(a t , v,|Fj_i) = Cov[a t , Z t {a t - 
= Cov[s t ,Z t {s t - s t | t _i)|F t _i] = 

因为 //, 是可 逆的 . 所以这里假定 V, 是可逆的 . 利用 (11.53) 式和 （ 11.57) 式，我 
们得到 


s t+i|t = d t 4 - T t a t \t-\ 4 - T t C t Vf l v t = d t + T t 8 t \ t _i 4 - K t v t , 


其中 


K t = T t C t VZ l = T t Jl t]l _,Z' t Vj\ 
是 f 时刻卡尔曼增益.利用定理 11.1(2), W 


(11.58) 

(11.59) 


= Var(s t |F t _i) 

= Var(s t |F t _ 1 ) - Cov(s,, v t )[Var(v,)j 'Cov (〜， ％)' 

= ~ c t v ： x c[ 

= ^ t | e-i - 1 (11.60) 

将 (11.60) 式代入 （11.54) 式，并利用 (11.59) 式，得到 


= + RtQtR[i (11.61) 


其中 


Lt = T t - KtZ t . 

将上述方程综合在一起，对于 (11.24) 式和 (11.25) 式所给出的状态空间模型，我们 
得到其著名的卡尔曼 滤波. 给定初始值 . s 1|0 和^ 1|0> 长尔曼滤波筧法为 


Vt = y t - c t - ZtSt ^ x , 

V t = Zt ^ t \ t -\ Z' t + H t , 

K t = T t ^ t _ l Z ' t Vr \ 

Lt . = Tt — KtZt , 
s f+i|e = dt + + K t v t , 

St+ijt = T t E t | t _ 1 L / t -f RtQtR ^, t = 1, ••- , T . 


(11.62) 
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如果对滤波暈和 S , | t 也感兴趣，我们将修正滤波使其同时包含滤波方程 
(11.57) 式和 （11.60) 式.这样得到的滤波算法为 

vt = Vt ~ c t — ^ t 8 t \ t-U 

V t = Z f E t | t _, Z ； + = Z t C t + H h 

st\t = s t\t-i + CtV^ l v t , 

St|t = St|e-i ~ ctvr'c；, 

s f + i|t — df \- T t 々| t ， 

= + RtQfRt - 


稳定状态 

如果状态空间模型不随时间变化.即所有的系统矩阵也不随时间变化，则矩阵 
收敛到常矩阵 s ,， 而 ru 是矩阵方程 

S, = TE.T 7 - TS,ZV _ 1 ZS.T , + RQR'. 

的解，其中 V = 2 TS ./ + H . 收敛到 E . 后所得到的解称为卡尔曼滤波的 稳定状 
态解 ( steady-state solution ). —旦达到稳定状态解， V " t , 和 Et . 卜 i|t 就都是常数- 
这在计算中能大大的节省时间. 

11.4.2 状态估计误差和预测误差 

状态预测误差定义为 


Xf = 沒於 一 1 • 

从上述定义知， A 的协方差矩阵为 Var ^ lFt - x )- 沿袭 11.1 

节的方法，我们可以推断 A 的性质.首先 t 由 （ 11.55) 式有 

Vt = Z t ( 8 t - Sf|t-i) + = Z t x t + e t . 

其次，由 （ 11.62) 式、 (11.24) 式以及前面的方程，得到 

* t - M = « i+l - 

= Tt{st - + Rt^t ~ ^tVt 

= T t Xt + R , ri t - K^ZtXt + e t ) 

= L t x t + R t T], - K t e t , 

其中.和前面一样， L t = T , - K , Z ,. 因此，我们可以得到 w 的状态空间形式 

v t = Z t x t + e tl x t+ i = L t x t -h RtVt - K t^u (11.(53) 

其中 *1 = si — s^\ 0 {t = 1，…， r ). 

最后，类似于 li . i 节的局部趋势模型，我们得到向前 I 步预测误差彼此 
相互独立且 , v T } 和 Fe _, 相互独立. 
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11.4.3 状态平滑 

状态平滑主要讨论给定仏条件下〜的条件分布.值得注意的是 （ a ) 

和 {«*,-•• , v T } 是独 立的； （ b ) 是序列独立的.对于给定条件下 s , 和 

{ v tr -- , v T } 的联合分布应用定理 11.1 可以得到 

= E ( st | Fr ) = v t , - • - y v T ) 

T 

= E ( s f | F t _ i ) + ^2 Coy { s t , Vj )[ Vai ( v t )} l v t 

j=t 

T 

=+ ^2Cov(8t,v j )V^ l v i , (11.64) 

i=i 

其中，协方差矩阵是给定 F ^ x 条件下的条件协方差矩阵.目对于 j = ， T , 协 

方差矩阵 Cov ( s ,,~) 可以如下推出.由 （ ll . fi 3) 式有 

Cov(a t , 〜） = E(s t t)j) 

= E\8t{ZjXj - ejY] = E(« t a ； j)Zj, j =t ， ." ， T. (11.65) 

此外还有 

= F ![ Sf ( S 4 — = Var ( s /) = 

E (»« x t+i) = ^[st(L t x t + RtVt - Kte t )'\ = 

E ( Sf ； c ;+ 2 ) = j , 

E ( s < a ;^) = - - • X ^_ j . (11.66) 

将上面两个公式代入 （11.64) 式，对于 f = 7 1 - 2, r - 3,… ， 1，有 

« T|T 一 a , r | T — 1 + T — l ^ T ^ T ^ 

a T - l|T = s T - l | T -2 + S 7 '| ； r - l ^'_ iV r 7 i 1 V 7 '-l + ^ T \ T - l ^> T -\^' r ^ T iv T , 

S /|T = a t|t-i + + Y, t \ t _ l L' t Z' tJrl V'[^ x vt^\ 

+ …+ ''' L ' T _ l Z ' T V ^ r l VT- l 

这里，当 f = 7 1 时有 M = I rn . 这些平滑状态向量可以表示为 

s t|T = s t | t-i + (11.07) 

其屮 Qt—i ~ t ^ v Ti Qt —2 = ^ t —^ Y r - i v T-i + Lj >_ iZj > Vy l v>r -&• 

Qi-i = ' v t 十 + … + L' t L' t+l - • - L' t _ x Z' t V T x vt. 
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(t = T -*2, T -3,-.., l ). 是发生在时刻 t -1 后的向前1步预测误差力的加 

权和.由前面方程的定义知,％可以通过下述向后递归得到 

9 t — 1 = t 1 v t + t = T 1 ■' • , 1, (11.68) 

其中 q r = 0. 联立这些方程，我们得到平滑状态向量的向后递归 

Qt—i = t 1 仍 + St|T = 3 中 -1 + lt ( = T" ， ’.. ， 1 ， (11.69) 

该递归从 q T = 0 幵始，而且 L 和可通过卡尔曼滤波得到.在 
相关文献里这就是 固定区间平滑 (fixed interal smoother ). 参见 de Jong (1989) 和其 
屮的参考文献. 

平滑状态向量的协方差矩阵 

下面，我们将推导出平滑状态向暈的协方差矩阵.对于给定 F t _, 条件 下七和 
, v r } 的条件联合分布应用定理 11.1(4), 得到 

T 

S<ir = - y ^ Cov ( a t , Vj )[ Var ( t ; i )]~ 1 [ Cov (8 t ,^ j )] / . 

i=t 

由 （11.65) 式和 (11.66) 式里的协方差矩阵.进一步可得到 


-- • • • L , T _ l Z , T V^ i ZtLt - 1 • • • I/t 


E 


t | t-i 




其中 


M ( _, = Z \ V - t x Z t ^ L '. Z ^ V -^ Z^Lt 

+ . •. + X/; " . l!'y_ i Z' T V ^ 1 ZtLt—\ • • • Lt. 

当 t = r 时仍然有 L ； ... = J m .由该定义矩阵 M t _, 满足 

M,_! = Z' t V^Z t +L[M t L t , t = T r -- ,1, (11.70) 

且初值为 M t = 0 . 综合前面的结果，我们得到计算 S t , T 的向后递归公式 

1 Zt + S t j7' = — S t | t _i A/( ； _iS / | t _i, (11.71) 

其中 / = 7 V ..,1 且 / lf T =0. 注意正如 11.1 节里的局部趋势模型， M t = Var ( 9 ,). 
联合上面平滑状态向量的两个向后递归公式，我们有 


Qt-l=K v t lv t.+ L[q t , 

s t|T = s e | e-i + 

M < _ j = Z ； Vr 1 Z , + L ； M < L / , 

S<|r = — t = T \... ， 1, 


(11.72) 
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其中 == 0 H . Mt = 0. 

假定 (11.24) 式和 （ 11.25) 式里的状态空间模型已知，则卡尔曼滤波和状态平 
滑可以通过两步运算得到.首先，对于 * = 1 ， ... ， T ， 使用 (11.62) 式里的卡尔曼滤 
波并获得量〜 A ：,， 和其次，对于 t = T , -- ,1, 应用 （ 11.72) 式 
的状态平滑法 得到％ 7 和 E t|r . 

11.4.4 扰动平滑 


令 e f | T = E ( e t | F r ) 和 r/, |T = E ^ Ft ) 分别表示观测方程和转移方程的平滑 
扰动.这些平 滑扰动 (smoothed disturbances) 在许多应用领域（比如在模型检验中) 
都很有用.在本小节，我们将学习计算平滑扰动及其协方差矩阵的递归算法.再次 
对于给定 F t -, 条件下 e < 和 {〜,.••，《 r } 的条件联合分布应用定理11.1,得到 

T 

e t \r = E(e,\F t ^,v t ,-- ,v T ) = ^ E ( e # Wj ) V ~ 1 v i , (11.73) 

这里用到了 R ( q | F , ,) = 0利用 （11.63) 式有 


E(e t v , j ) = E(e t x , J )Z' J -hE(e t e , j ). 

由于 E ( c t a ；0 = 0,从而有 

E ( e ^)=( 若 j = t ' 

反复应用 （11.63) 式以及 { e ,} 和之间的独 立性， 我们得到 


(11.74) 


E« 2 ) = -H t K t L' t+x 


E ( etx , r ) = - H t K' t L '^ - - • L ' r _ x , (11.75) 

其中当 * = ：T - 1 时，有 £/ t +1 …基于 (11.74) 式和 （11.75) 式，得到 

«e|T = H t (V ； l v t - K\Z' t ^V^v t+x - K[L[ +l • • • Z' r V^v T ) 

— H ^ V^Vt - K \ q t ) — H t o t , i = T ,••• ,1, (11.76) 

其中由 （11.6 7 ) 式定义且 o , = V ； l v t - K [ q t . 我们将称 为平滑測量误 
差 (smoothing measurement error). 

平滑扰动 & |7 . 可用类似的方式推导出，即 

T 

VtlT^Yl E ( r 1( v j ) V j lv J - 


(11.77) 
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(11.67) 式的状态空间模型给出 

E /„ ) = / ^ tK Z ， t+\y 若 ht + l , 

其中，对于* = 1，…， T , 有 

El 刀 t X l+2) = Q(-Rj£rj +1 , 

El:”, x ;+3) =Q L[ +2 , 


E \ ji t x f T ) = Q t R ! ( L \^ - • • L ^_ j , 

因此. (11.77) 式意味着 

Vtyr = + ^ / t + i ^ W 2^ r t ^2 v t +2 

+ ... + L [ +1 • - • Lt—i 1，t ) 

= Q t R ' t q t , t = T ^-> ,1, (11.78) 

其中 g , 由先前的 (11.68) 式所定义. 

Koopman (1993) 利用平滑扰动 T7 t|T 推导出一个计算 . s <|T 的新的递归方法.由 
(11-24) 式的转移方程，有 

S /+1 |T — dt + TfSfiT 1 - f - RtT / t ^ T . 

利用 (11.78) 式可得 

8 i I i|T = d t + T + fttQt ^ = 1, • • ■ ，^ 1 , (11.79) 

其中初始值为且如从 (11-68) 式的递归方程中得到. 

平滑扰动的协方差矩阵 

平滑扰动的协方差矩阵同样也可以通过定理 11.1 得到，具体地 
Vfir ( e ,| Ft ) = VaKe /' lF ，—,. r ,， … , vr ) 

T 

=Var(e t |F^_]) - ^ Cov(e t , Vj)^ l [Cov(e t ,u i )] / . 

j=t 

注意 (11.74) 式给出 Coy { e tl v j )= E { e t v , j ). 因此我们有 

Var(e t |F T ) = H t - H t \V； x + K'.Z'^V^Z^K t 
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+ .. • + K\lj t ^ • • - L'rp_^ Z'-pV-p 1 Zj'Lj'—i • • - Li^.\Ki)Ht 

^H t - HdVT 1 + K' t M t K t )H t 
=H t -H t N t Hu 


其中 TV , = Vr 1 + K ', M t K t . 这里的 M , 由 (11.70) 式给出.类似地 

T 

Var(77,|F r ) = Var(r 7 t ) - Cov(r 7 f , v,)Vf ^CovC^, v t )] _1 , 

其中 Cov ( i7 (1 Vj ) = EirjfV ^) 在推导仏 y 的公式时己经给出.因此 

Var(// t |Fr) — Qt ~ + C+iA+-2 ^^2 心 +2 厶 *+1 

+ … + L' t+X • • - L ' T _ i Z ' T V^ i ZtLt-x - • - L t ^ i ) RtQ , 

= Q l - Q t R , l M l R , Q r 


总之，扰动平滑算法如下 

e tl r = H t ( Vr 1 w ( - A ：； q t ), 

^ f|T = 

Qt i = Z , t V ； 'v, + L\q t , 

Var(e t |F r ) = H t - //“Vr 1 + K' t M t K t )H u 
Var(7 7t |F r ) = Q 1; - Q t R\M t R t Q t , 

M,. x - Z[V- ] Z ，+ 山，卜 T， … ， 1 ， 

其中 = 0 且 A /7* = 0. 


(11.80) 


11.5 缺失值 

对于 (11.24) 式和 (11.25) 式中的广义状态空间模型，我们考虑缺失值的两种 
形式.首先，类似于 1 U 节中的局部趋势模型，假设在时刻 t = f + l，...，f + /,. 的 
观测值 y , 是缺 失的. 此种情况下,在这些时间点上，没有新的信息.我们令 

Vt = 0, K t =0. for t f + 1, ... 十 /i. 

这时和 平常一 样就可以运用 （ 11.G2) 式中的卡尔曼滤波.也就是 

s t+i|t = dt+ Tt« 4 |t_i, S(p + i| t = 中 _|T^ + R t Q t Hf t1 

这里 f = + 类似地，对于 f = €+1 ，… J + h 平滑状态向最也可以像 

往常一样通过 (11.72) 式计算如下 


Qt-i = T t q” M t-i = T" f A/ tTi, 
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在第二种情形，部分缺失.设 W = Jy t 为《时刻所观测到的数据向量，这里 
J 为识别观测数据的指示 矩阵. 更具体地讲. •/ 的行是 fc xA - 单位矩阵的子集.此 
时，模型的观测方程 (11.25) 式可以转换为 

yr = Ct + z t s t + e t^ 

其中 c? = Jc t , Z\ = JZ t 和 e; = Je,, 目协方差矩阵 Var(fi*) = H ； = 

了时刻 f 使用修正的观测方程外，可以继续应用卡尔曼滤波和状态平滑递归 . 因此， 
状态空间模型的一个好的特点就是便于处理缺失值. 

11.6 预 测 

假定预测原点是 i 且我们关注 y t ^ 的预测值 7 j = 1 ? .. •,/»., /i > 0. 我们仍然 
采用最小均方误差预测.类似于 ARMA 模型.向前 j 步预测误差 y t [ j ) 就是给定 
Ft 条件下的条件期望值.也就是说， y t ( j ) = E ( y t + j \ F t ). 下面，我们将证明这 
些预测和相应的预测误差的方差可以通过 (11.62) 式中的卡尔曼滤波得到，只是此 
时将看作缺失值，这正是 11.5 节的第种情形. 

考虑向前 1 步预测误差.由 （ 11.25) 式 

l/t ⑴ = E(y y , j|F<) = c t +i 4- Z, + i8 t+ m ， 

其中 8 (+1 „ 可以通过预测原点为 / 时刻的卡尔曼滤波得到.相应的预测误差为 

e t(l) = J/t+i - — s t+ i | t ) 十 et+i. 

因此，向前1步预测误差的协方差矩阵为 

Vax [ et ( l )] = Z + 丑 t + i . 

这正是 (11.62) 式中卡尔曼滤波的协方差矩阵 V t + u 于是.我们证明了 h = l 的情 
形.对于 h > L , 我们按顺序考虑 1 步到/^步的向前预测.由 （ 11.25) 式，向前 j 步 
预测为 

VtU) = ct+j + Zt+jS t+j i t , (11.81) 

且相应的预测误差是 

e t(j) = ^t+j(st+j - 〜 + 川）十 

值得注意的是， 〜 +7| t 和 E t + J | t 分别是给定 F t 条件下的条件均值和条件协方 
差矩阵.上式说明 

Vas[ti t (j)] = 妁十 H t+j . (11.82) 





进一步，由 （ 11.24) 式 
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**+J+l|t = ^t+j + T t+jS t fj\t, 

这反过来意味着 

~ s <+i+i|t = — 4- Rt+jTi t ( j. 

因此 

A 十 j+i|t = R l+ jQ (11.83) 

值得注意的是， Var[c t (j)] = V t+3 且对于 i+j, j = I,--- t h , (11.81)-(11.83) 
式是由 (11.62) 式给出的卡尔曼滤波的递归公式，且此时 v t+j = 0, K t+J == 0 .因 
此，预测值 y t ( J ) 和其预测误差 e f ( i ) 的协方差矩阵都可以通过带有缺失值的尔 
曼滤波得到. 

最后，可以利用误差预测序列 { tM 来计算估计时用到的似然函数且标准化的 
误差预测 Dr 1/2 / v t 可以用米进行模型检验.这里 D t = diag { V t ( l , l ), •• - , V f ( A -. A :)} 
且 V t ( i ， i ) 是 V t 的第 （ i ， i ) 个元素. 

11.7 应 用 


在本节中，我们考虑状态空间模型在金融和商业中的一些应用.我们的目标是 
突出模型的应用且演示 S-Plus 中用 SsfPack 进行分析的实际操作. 

例 11.2 考虑 General Motors(GM) 股票从 1990 年 1 月到 2003 年 12 月的月简 
单超额收益率的 CAPM. 参见第 9 章.我们将 S&P 500 复合指数的月简单超额收 
益率作为市场收益率.我们从简单市场模型开始 

r t = a + 4- e t , e. t ~ AT ( n , rrl) (11.84) 

f = 1,". ,168. 这是一个确定系数的模型，很容易通过普通最小二乘方法 （ OLS) 来 
估 W . 分别用 gm 和 8 p 来表不 GM 股票收益和市场收益，结果如下给出. 

> fit=0LS(gm-sp) 

> summary(fit) 

Call: 

OLS(formula = gm - sp) 

Coefficients : 

Value Std. Error t value Pr(>|t|) 

(Intercept) 0.0020 0.0063 0.3151 0.7531 

sp 1.0457 0.1453 7.1964 0.0000 

Regression Diagnostics : 

R-Squared 0.238 
Adjusted R-Squared 0.233 
Durbin- Wat oon Stat 2.029 

Residual Diagnostics : 

Stat P-value 
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Jarque-Bera 2.537 0 .281 

Ljung - Box 24.207 0 . 117 

Residual standard error : 0.0813 
因此，所拟合的模型为 

re = 0.02 十 1.045 7r^f ( ^ 十 a t — 0.081 3. 

基于残差诊断，模型对于 GM 股票的收益似乎是充分的且有修正后的胪 = 23.3%. 

正如 11.3 节，模型 (11.84) 式是状态空间模型的一个特例 . 我们利用 SsfPark 
来估计该模型 . 结果如下： 

> reg.m=function(parm,mX=NULL){ 

+ parm=exp(parm) % log(sigma.e) used to ensure positiveness. 

十 ssf♦reg=GeLSs£Rey(mX) 

+ ssf.reg$mOmega[1 # 3]=parm[1] 

+ CheckSsf(ssf.reg) 

+ } 

> C.BLdXt=C(0.1) 

> reg.fit=SsfFit(c.start,gm,"reg•m",mX=X.mtx) 

RELATIVE FUNCTION CONVERGENCE 

> sqrt(exp(reg.fit$parameters)) 

[1 】 0.00129934 

> 

% Next, perform smoothing 

> ssf•reg$mOmega[3,3]=exp(reg.fit$parameters) 

> reg • s=Saf Moment Esc. (gm, ssf • reg, task - "STSMO " 〉 

> reg.s$state.moment[10,] % use 10th row to avoid impact 

state.1 state.2 % of the starting value. 

110,J 0.001985928 1.045712 

% Next, obtain standard errora of eotimatea 

> sqrt(reg.s$state.variance[10 , 】 ） 

state.1 8tate.2 
0.006301SJ27 0.14b3096 

如所料想，整体上该结果和 OLS 方法所得出的一致 . 

最后，我们采用 11.3.1 节的时变 CAPM. 下面给出了估计的结果，包括平滑响 
应变量的时 间图 . 利用命令 SsfCondDens 计算状态向量和观测的不带方差估计的 
平滑估计 . 

> tv.capm = function(parm,mX=NULL){ % Setup the model 

♦ parm=exp(parm) %parameterize in log for positiveness. 

♦ Phi .t = rbind(diag(2) r rpp(0,2)) 

+ Omega=diag(parm) 

+ JPhi=matrix(-1 # 3,2) 

+ JPhi[3,1] *1 
+ JPhi[3 # 2]=2 
+ Sigma*-Phi.t 

♦ ssf.cv=lisc(mPhi=Phi.t # 

4 - mOmega=Omega # 
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+ mJPhi=JPhi, 

+ mSigma=Sigma , 

+ mX=mX) 

♦ CheckSsf(ssf.tv) 

o 

> tv.start=c(0,0,0) %starting values 

> tv . tule=Saf Fit (tv. start , gm, M tv.capm ,t , mX=X.mtx) %estimation 

> sigma.mle=sqrt(exp(tv.mle$parameters)) 

> sigma.mle 

1.168806e-05 0.00D7428207 0.08129916 

% Smoothing 

> smoEst.tv=SsfCondDens(qm # tv.capm(tv.mle$parameters, 

+ mX=X.mtx),task="STSMO") 

> names(smoEst.tv) 

[1] "state" "response" "task" 

> par(mfcol=c(2 # 2)) %plottinq 

> plot(gm # type= # 1 # # ylab= / excess return 1 ) 

> title(main='(a) Monthly simple excess returns*) 

> plot (dmoEst. tv$iresporise, type= 1 1 1 , ylab- # rtn # ) 

> title(main= # (b) Expected returns # ) 

> plot(smoEst.tv$state[,1],type='1 ， ， ylab= # value r ) 

> title (main=* # (c) Alpha (t) # ) 

> plot(smoEst.tv$state [,2] t type*'1 # ,ylab-* value ， } 

> title(main= # (d) Beta(t) # ) 

汴意 . ％和分别为 1.17 x 10_ 5 和 0.74 x 10~ 3 . 这些估计和 0 非常接近，表明 
对于 GM 股票的收益率而言时变市场模型中的 … 和汍 木质上是常数 .这与确 
定系数的市场模型能很好地拟合数据这个事实是一致的.图 11-5 给出了有关时变 
CAPM 的一些图 . （ a.) 是从 1990 年 1 月到 2003 年 12 月的 GM 股票月简单超额收 
益率的时间图 . （ b) 是 GM 股票的期望收益，即 r t , Tl 其中 r= 168 是样本容量 . （ c) 
和 （ d) 分别是叫和 A 估计的时间图 . 对于给定的刻度紧密的纵轴.这两个时间图 
均证实了确定系数的市场模型对于 GM 股票的月收益率是充分的 . 

例 11.3 在本例中，我们利用不可观测的成分模型 E 新分析 Johnson 股票的季度 
收益序列，时间区间是从 1960 年到 1980 年.数据的细节参见第 2 章.考虑的模 
型为 


yt = y-t + 7i + e t , e t 〜 AT(0,0^)， (11.85) 

其中讲是观测到的每股收益的对数 . ^为局部趋势项且满足 

沟+1=叫 + 取， r?t 〜 #(0,4 )， 

且 7 t 是季节项且满足 

{IB-\- B 2 B 3 )7t = 〜 N(0 ， c ^)， 

也就是说 = j +叫_此模型有三个参数 a e ， ％和这是一个简单的 






其中，的协方差矩阵是且讲= [1, l ,0,0 ]»t + e t . 参见 11.3 节. 其 
实这是 SsfPack 中结构时间序列的特例且很容易利用命令 GetSsfStsm 给出.进行 
最大似然估计，我们得到 { a e , a v ，&^) = ( U . U 14 3, U .2 b 9 6,0.171 2). 


Vt. 

u； t _ 


不可观测成分模型.该模型的状态空间形式为 


0 50 1(10 U>0 n 5() 100 150 

(b) (d) 

().05 
^ -0.0G 
-0.15 

0 50 103 150 0 5U 1UI) 150 

图 11-5 将时变 CAPM 应用子 GM 股票的月简中超额收益宇时一些统计量的时间图. S&P 
r>nn 复合指数的月简单超额收益率作为市场收益率， （a) 月简单超额收 益率； （b) 超 
额收益 r # |T； (c) OLi 的估计； （d) A 的估计 

> jnj=scan(file= # q-jnj.txt # ) 

> y-log(jnj) 

% Estimation 

> jnj.m=function(parm) { 

+ parm=exp(parm) 

• jnj.oca=GetSsfStem(irregular-parm[1],level 二 parm[2 】， 

+ seasonalDummy=c(parm[3] # 4)) 

+ CheckSsf(jnj.sea) 

+ } 

> 

> c.startle (0,0,0) % Starting values 

> jnj.est=SsfFit(c.start # y,"jnj.m"} 

> names(jnj.est) 

[1] 11 parameters M M objective M "m^SRag 户 " 11 grad . norm" 

[5 】 "iterations" "f.evals" "g.evals" "hessian" 

[9] M scale w "aux" "call" 



/xe-fi 1 0 0 0 10 

7 t +1 — 0 — 1 一 1 一 1 0 1 

7 t 0 10 0 7 卜 1 0 0 

7 卜 l 0 0 1 0 7t-2 0 0 
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$mDelta : 


[, 2 ] 

tl,] 1 0 

[ 2 ,] 0 -1 

[3,1 0 1 

[4,] 0 0 

t5,] 1 1 

$tnOmega : 

[, 1 ] 

[1,] 0.07270 0. 
[ 2 ,] 0.00000 0 . 
[3.] 0.00000 0. 
[4,] 0.00000 0. 
[5,] 0.00000 0. 
$mSigma : 

[, 1 ] [, 2 ] 


$mJPhi : 
[ 1 ] 0 
$mJOmega : 
[ 1 ] 0 
$mJDelta : 
[ 1 ] 0 
$mX ： 

tl] 0 
$cT ： 
tl] 0 
$cX ： 

[ 1 ] 0 

$CY: 

U] 1 

$cSt : 


[,3] [,4] 

0 0 

-1 -1 

0 0 

1 0 

0 0 

【， 2] [,3] [,4] [,5] 

00000 00 0 

02932 0 0 0 

00000 00 0 

00000 00 0 

00000 0 0 2.044e-06 


t.3] [,4] 

0 0 

0 0 


> jnjest=sqrt(exp(jnj.est$parameters)) 

> jnjest 

【 1 】 0.001429867 0.269622976 0.171221806 % Estimates 

% Next, specify the mod«>l with estimates 

> jnj . ssf=GetSsfStsrn(irregular=jnjest [1] , level=jnjest [ 2 ], 
+ seasonalDummy=c(jnjest 【 3],4)} 

> CheckSsf(jnj.ssf ； 

SmPhi : 



1 3 1J TJ 1J 
12 3 4 5 

rL rl rL rl > » 
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[1] 4 

attr( , "class") : 

[1] "ssf" % below ： smoothed components 

> jnj.smo=SsfMomentEst(y,jnj.ssf , task= H STSMO u ) 

> upl=jnj•smo$state.moment 【， 1】 + 

+ 2*sqrt(jnj.smo$state.variance[ # 1]) 

^ lwl=jnj.smo$state.moment[ # 1] - 
+ 2*sqrt(jnj.smo$state.variance[, 1 】 ） 

> max(upl) %obtain range for plotting 

[1] 3.067664 

> min(lwl) 

[1 】 -1.063997 

> up=jnj.smo$state.moment [,2] + 

十 2*sqrt(jnj.smo$state.variance[,2] } 

> lw=jnj.smo$state.moment[,2] • 

+ 2*sqrt(jnj.smo$state.variance[,2]) 

> max(up) 

【 1] 0.5909587 

> min(lw) 

【 1] -0.6157968 

> par(mfcol=c(2,1)) %piotting 

> plot (tdx # jnj . ctno$otate . moment [, 1] , type- ’ 1 ’ , xlab-^ year # , 

•f ylab='value',ylim=c (-1 • 1,3.1)) 

> lines(tdx,upl # lty=2) 

> lines(tdx # lwl # lty=2) 

> title (main-= # (a) Trend component # ) 

> plot(tdx,jnj.smo$state.moment [,2], type= 4 1 # ,xlab=’year ’， 

+ ylab= # value # ^ylim^c(-.62,0.6)) 

> lines(tdx,up,lty=2) 

> lines(tdx,lw f lty-2) 

> title (tnain= # (b) Seasonal component f ) 

% Filtering and smoothing 

> jnj.fil=KalmanFilly,jnj.ssf # task= M STFIL M ) 

> jnj•smo=KalmanSmoIjnj•fil,jnj•ssf) 

> plot (tdx, jnj . f il$mOut 【， 1 】 ， type= # 1 # # xlab= # year 、 

+ ylab= # resi # ) 

> title(main= r (a) 1-Step forecast error") 

> plot(tdx # jnj.smo$response.residuals [2 :85 】 ， type= # 1 # # 

+ xlab= # y^ar 1 # ylah= 9 resi 9 ) 

> title(main= # (b) Smoothing residual # ) 

图 11-6 给出了趋势项和季节项的平滑估计，即叫 jT 和 7t|T 且 T - 84 . 令人感 
兴趣的是季节项似 T 随时间变化 . 图中还给出了不可观测项的置信水 T 为 95 %的 
逐点置信区间 . 图 11-7 给出了残差图 . 其中⑷ 给山了利用 K 尔曼滤波汁算的向 
前 1 步预测误差而 （ b) 为拟合模型的平滑响应残差.因此状态空间模型给出了另 
外一种选择来分析季节时间序列 . 必须说明的是图 11-6 给出的估计项并不是唯一 
的 . 它们依赖于指定的模型和选用的参数 . 实际上，将可观测 N 间序列分解成不可 
观测项的方法有很多 . 例如，对于季节项可以指定不同的模型，比如，利用 S.sfPark 






中的 season alTrig 来得到 Johnson 和 Johnson 公司收益序列的另一种分解因此 . 
在解释被估项时要特别的小心 . 然而，如果出子预测的目的，只要选抻的分解方式 
正确，对于分解方式的选择并不重要 . 

(») 

扫 

100() 10G5 1970 1975 1980 

年 

(b) 

U.0 

_ 0.2 
^ - 0.2 
- 0.6 


图 11-6 给 Johnson 股票的对数季度收益序列所拟合模型 (11.85) 式的平滑项，时间区间是 
从 I960 年到1980年： （a) 趋 势项； （b) 季节项.点线为置信水平为95%的逐点置 
信区间 

(a) 向府1少预测误差 

m 

* 


年 

(i>) 平滑残差 


年 

图 11-7 给 Johnson 股票的对数季度收益序列所拟合模型 (11.85) 式的残差序列： （a) 向前 
1步预测误差 ( h> 响应变擀的平滑残差 


练习题 

11.1 考虑 ARMA (l.l ) 模型的- 0.8i/ t _, = a, +0.4^ — ^ ，其中 a, 〜 N(M).49) 的.分别利用 
(a) Akaike 方法； （b) Harvey 方法 ：（c) Aoki 方法将该模型转化成状态空间形式. 



1000 19GTj 1970 1975 1980 
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11.2 文件 aa - rv -20 m . txt 包含了 Alcoa 股票收益序列从2003年1月2日到2007年5月7 
日的日已实现波动率.参见 11.1 节的例子.波动率序列由每日内间隔20分钟的对数收益 
计算. 

( a ) 给对数波动率序列拟合一个 ARMA ((),1.1) 模型并写出该模型. 

( b ) 对于对数波动率序列估计 (11.1) 式和 （11.2) 式的局部趋势模型.参数 〜和 的 
估计是什么？给出滤波和平滑状态变最的时间图和置信水平为95%的逐点置信区间 
图. 

11.3 考虑 Pfizer 股票和 S&P 500复合指数的月简单超额收益率，时间区间是从1990年1月 
到2003年12月.超额收益串包含在文件 m - P fe 3 p - e x 9 00 3 . txt 中，且笫一列为 Pfizer 
股票收益率. 

( a ) 给 Pfizer 股票收益率拟合一个确定系数的市场模型并写出该模型 

( b ) 给 Pfizer 股票收益拟合一个时变的 CAPM . …和 A 序列中新息的被估标准误差是 
多少？给出…和冰的平滑估计的时间图. 

11.4 考虑 AR (3) 模型 

Xt = + <p2^t - 2 + 03®t-3 + Of ~ N{0, 

且假设观测数据是 

yt — x t -\- e { , e t 〜 W (0, o ^)， 

其中 { e ,} 和 { a t } 独立且％(：/ s ； n ) 的初始值和心(< > 0) 与 a t (t > 0) 是独立的. 

( a ) 将该模甩转化成状态空间形式. 

( b ) 如果 E ( e t ) = c , 且不为 （)， 则系统相应的状态空间形式是什么？ 

11.5 文件 m - ppiaco . txt 包含了年，月，日和 U . S . 制造业价格指数 ( PPI ), 时间区间是从1947 
年 I 月到2004年的8月.该指数针对所有的日用品且没有经过季节调整.设 A = 
ln ( Z t ) - In (厶-:)，其中乙是观测到的月 PPI . 如果忽略极小的季节依赖性，则 AR (3) 
模型对于似乎是充分的•令讲表示样本均值修正后的 Q 序列. 

( a ) 给 y t 拟合一个 AR (3) 模型并写出该模型 • 

( b ) 假设 y t 有独立的测量误 差且识 = Xe + e () 其中 T , 是一个 AR (3) 过程 _EL Var ( e t ) = 
al . 利用状态空间形式去估计参数，包括状态新息的方差和心 2 .写出拟合的模型并 
给出; r , 平滑估计的时间围.另外.给出所拟合状态空间模型的滤波反应残差的时间 
图. 
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第 12 章马尔可夫链蒙特卡罗方法及其应用 

计算工貝与计算方法的进步已经大大地增强了我们解决复杂问题的能力•这 
种进步也扩展了许多已有计景经济方法和统计方法的应用统计中这种进步的例 
子包括马尔可夫链蒙特卡罗方法 （ MCMC ) 和数据扩展.有了这些方法，我们便能够 
进行一些几年前还不可行的统计推断.本章引进了金融中广泛使用的 MCMC 方 
法和数据扩张的思想.特别地，我们讨论经由 Gibbs 抽样的贝叶斯推断，并演示了 
MCMC 方法的各种应用. MCMC 方法论的迅速发展不可能涵盖所有在文献中出 
现的新 力法. 感兴趣的读者可以参考一些近期的关于贝叶斯统汁和实证贝叶斯统 
计的书（例如 Carlin and Louis , 2000; Gelraan , Carlin , Stern anti Rubin , 2003). 

对于应用，我们把注意力放在与金融计量经济学有关的问 题上. 本章屮所表述 
的仅仅是此方法在金融中所有可能应用中的—小部分.事实上，公正地说，我们这 
里讨论的贝叶斯推断和 MCMC 方法在金融计量经济学的大多数研究（如果不是全 
部的话）中，都是切实可行的. 

首先回顾一下 马尔可夫过程 (Markov process ) 的概念.考虑一个随机过程{ X ,}, 
这里假定每个 A ：, 都在空间0上取值.称过程 { X f } 是一个马尔可夫过程.如果它 
具有 性质： 给定的值. X fl [h > t ) 的值不依赖于 X s {s < t ) 的取值.换句话说，称 
[ X t ) 是一个马尔可夫过程，如果它的条件分布函数满足 

P ( X h \ X e ,n < 0 = 尸 ( XhiX t )，h > L 
如果{ X ,}是一个离散时间的随机过程，则前面的性质变为 

PiXhix^Xt-u . •.) 二 r(x h \x t ), h>t. 

令4表示0的子集，则函数 

r t (0， h ， A ) = P ( X h € A \ X t = 0)， h > t 

称为马尔可夫过程的转移概率函数.如果转移概率依赖于& - 但是不依赖于<， 
则过程有一个平稳的转移分布. 

12.1 马尔可夫链模拟 

考虑参数向量为0和数据为久的推断问题.其中0 e ©• 为了做出推断•我 
们需要知道分布 P (0\ X ). 马尔可夫链模拟的思想是在0上模拟一个马尔可夫过 
程，它收敛于平稳转移分布 P { o \ X ). 
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马尔可夫链模拟的关键是构造一个具有指定的平稳转移分布 p ( e \ x ) 的马尔 
町夫过程，并且充分长地运行这个模拟.使得过程当前值的分布与平稳转移分布足 
够接近.对给定的 P (0\ X ), 可以证明能够构造许多具有所需性质的马尔可夫链.我 
们将利用马尔可夫链模拟来得到分布 P (0\ X ) 的方法称为 MCMC 方法. 

在统计文献中， MCMC 方法以各种各样的形式发展.考虑数据分析中的“缺失 
倌”问题.本书中讨论的统计方法都是在“完全数据，，(即没有缺火值）的假定下发 
展的例如，在给资产收益率的日波动率建模时，我们假定样本期间内的收益率数 
据在所有交易日都可以得到.如果存在一个缺失值，那我们应该怎么办呢？ 

Dempster , Laird 和 Rubin (1977) 提出-个称为 EM 算法的迭代方法来解决这 
个问题.这个方法包含两个步骤•第个沙骤，如果缺失值可以得到，则我们能够利 
用完全数据分析的方法來建立一个波动率模型.第二个步骤.给定可以利用的数据 
及拟合的模型，我们能够推导出缺失值的统计分办.填允缺失值的一个简单方法是 
利用缺失值的导出分布的条件 期望. 在实际中，可以用缺失值的一个任意值来开始 
这个方法，且迭代足够多的次数直到收敛.前面方法中的第一■个步骤涉及对一个指 

定的模型进行最大似然估计，称为 M 步.第二个步骤是计算缺失值的条件期望，称 
为 E 步. 

Tanner 和 Wong (1987) 以两种方式扩展了 EM 算法. 首先，他们引进了迭代 
模拟的思想_例如，可以简单地利用从缺失值的导出条件分布里抽取的一个随机数 
来代替缺 失值. 而不是用条件期望来代替.其次，他们利用数据扩张的概念扩展了 
EM 算法的 应用. 数据扩张意味着在所研究的问题中加入一个辅助变量可以证明 
许多的模拟方法通常可以通过数据扩张来简单化或加速.参见本章的最后一节 

12.2 Gibbs 抽样 

Gcman 和 Genian 夫人 (1984) 以及 Gelfand 和 Smith ( l "<}) 的 Gibbs 抽样(或 
Gibbs 样本）可能是最流行的 MCMC 方法.我们通过一个带三个参数的简单问题 
来引进 Gibbs 抽样的 思想. 这里所用的单词“参数”的意义非常广泛.在 MCMC 框 
架下，—个缺失的数据点就可以当作一个参数.类似地，一个不可观测的变量如资 
产的“真实”价格，在有 ； V 个交易价格可以得到的情况下，也可以认为是 at 个参 
数.“参数”这个概念与数据扩张是联系在一起的.这在我们讨论 MCMC 方沈的应 
用时将会变得很清楚. 

将这三个参数^别表 示为化 ，&和化.令 X 表示可用的数据集， M 表不 釆用 
的模哦这里的目标是估计这些参数以便利用拟合的模型做山推断.假定模型的似 
然函数很难得到，但是在绐定其他两个参数的条件下，单个参数的条件分布是可以 
得到的 • 换句话说.我们假定已知下面的三个条件分布： 

fi{Oi\e 2 ,o 3 ,x,M), h{B 2 \e^e u x,M), h{^\e x ,e 2 ,x,M), (12.1) 
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其中 sme ^ xM ) 表示给定数据、模型以及其他两个参数的条件下，参数 A 的 
条件分布.应用中.我们不需要知道条件分布的精确 形式. 需要的是从三个条件分 

布的每一个中抽取随机数的能力. _ 

令和 6» 3 , o 是0 2 和& 的两个任意的初始值，则 Oihhs 抽样如 f 进行： 

⑴从 / i (<9 i |^, u ,^, o , X , M ) 中抽取一个随机样木，并将抽取的随机数记为吣, r , 

(2) 从 f 2(02\0^ e ul , X . M ) 中抽取一个随机样木，并将抽取的随机数 记为心 , 1 ’ 

(3) 从/3 ㈣ 01,1,^,1，久，奶中抽取一个随机样本•并将抽取的随机数记为知,1. 
这就完成了一次 Gibln * 迭代，且参数变为和心 ，卜 

下一步，利用新参数作为初始值，重复前面随机抽取的迭代，我们可以完成另 
—次 Gibbs 迭代，并得到更新的参数 <91,2, 02.2 和 03,2. 我们可以重复前面的迭代 m 
次，得到一系列的随机抽取： 

(沒 1.1， U 3.1)，，.. ，(沒 l . m ， 沒 2， m ， 沒 3， m ). 

在一些正则性条件下，可以证明对一个充分大的 m ， H ， m ，03 ， m ) 渐近等价子来 
自于三个参数的联合分布 f ( e l . e 2 , d - A \ x . M ) 的一个随机抽取.正则性条件是弱的. 
它们本质上是要求对一个任意的初始值 （ h , o ,02, o , h , o ), 前述的 Gibbs 迭代有机会 
访问整个参数空间.真实的收敛定理涉及到利用马尔可夫链的理论.参见 Tierney 
(1994). 

实际中，我们利用一个充分大的％并且丢掉 Gibbs 迭代的前 m 个随机抽取 • 
来建立一个 Gibbs 样本，即 

(设 l , m 十 1 為 . m 十 1，沒 3, m 十 1)，…，（沒沒2,»»，设 3, n ). (12.2) 

因为前面的迭代建立了一个来自联合分布的随机样本，所以可 
以利用它们来做出统计推断.例如，氏的一个点估计及其方差为 

6i = —-— 5Z 氏 j ， 的 = — - — T (久，广良) 2 . ( 12 . 3 ) 

(12.2) 式中的 Gihhs 样本可以有许多种使用方法.例如，如果对于检验原假设 
H Q '9 x - 9 2 对备择假设 H a ：6 r ^ 0 2 感兴趣，则可以简单地得到0 =仏 - 如的点 
估计与其方差为 

0= -^― 51 o 2 = ^ ~ I i {0^-6 2 ^-6) 2 . 

n - m i = t；i , =ni+] 

则原假设可以利用传统的 P 比统计量 （ =来检验 • 

注释 1: Gibbs 抽样中被丢掉的前 m 个随机抽取通常称为预烧 （ burn - in ) 样 

本.预烧样本用来保证 （12.2) 式中的 Gibhs 样本确实与来自联合分布 f ( 0i , d 2 , 0 : i \ X , 
M ) 中的随机样本足够 接近. □ 
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注释 2:前面讨论的方法包含了运行单个长链并在预烧后保留所有随机抽取 
得到一个 Gibbs 样本.另一种方法是利用不同的初始值和一个相对小的„运行许 
多相对短的链.在每条链中，最后一次 Gibbs 迭代的随机抽取都可以用来建 立一个 
Gibbs 样本. 口 

由前而的介绍， Gibbs 抽样具有这样一个优点，即将一个高维的估计问题利用 
所有参数的条件分布分解为几个较低维数的问题.极端地，一个具有 n 个参数的 
高维问题可以通过利用 AT 个1维的条件分布迭代地 解决. 这个性质使得 Gibbs 
抽样非常简单且广泛 应用. 然而，将所有的随机抽取都简化为]维 fnj 题通常不是 
有效的. 当参数 高度相关时.值得将它们联合地抽取.作为说明，考虑三个参数的 
例子.如果^和内是髙度相关的，则可以在任何可能的情况下，采用条件分布 
/ 的，办吻， X , M ) 和 h(e 3 \d u 0 2 ,X,M). 这时一次 Gibbs 迭代 包含： 

( a ) 给定的条件下联合抽取 ( 0 u ( J 2 y , 

( b ) 给定 ( ff u 0 2 ) 的条件下抽取 0 3 . 

关于参数相关性对 Gibbs 抽样收敛速度的影响，更多的信息可以参见 Liu , Wong 和 
Kong (1994). 

在实 际中. Gibbs 样本的收敛性是一个重要 问题. 理论上仅仅指出当迭代次数 
m 充分大时收敛发生，而没有对 m 的选择提供具体的指导.许多文献己经建议了 
多种检验 Gibbs 样本收敛性的方法.但它们并没有得出关于哪个方法执行得最好 
的一致 结论. 事实上，没有任何一个可以利用的方法能100%地保证所研究的 Gibbs 
样本对所有的应用都是收敛的.检验方法的表现通常依赖于所处理的问题.实际应 
用中必须要注意这一特点.以保证没有明显的对收敛性要求的违背.对收敛性的检 
验方法参见 Carliu and F^ouis (2000) 以及 Gelman 等人 （1995). 应用中，以不同的 
初始值重复 Gibbs 抽样几次来保证算法收敛是很重要的. 

12.3 贝叶斯推断 

在 Gibbs 抽样屮条件分布起肴重要的 作用. 在统计文献中，这些条件分布被称 
为 条件后验分布 (conditional posterior distributions ). 因为它们是在数据、其他参数 

和一定的模型给定时参数的分布.本节将回顾一些在 MCMC 方法中有用的著名的 
后验分布. 

12.3.1 后验分布 

有两种统计推断的 力法. 第一种方法是基十最大似然原理的经典方法.此时模 
型通过最大化数据的似然函数进行估计.且利用拟合的模型做出推断.另一种方法 
是贝叶斯推断，它将先验的思想与数据结合得到后验分布，然后基于后验分布进行 
统计推断.历史上，在两类统计推断之间有着激烈的争论.但经证明两种方法都是 
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有用的，而且现在都被广泛接受.到目前为止.本书讨论的方法都属于经典方法.然 
而，对所考虑的所有问题，贝叶斯解都是存在的.近年来随着 MCMC 方法的发展 
尤其如此，这是因为 MCMC 方法大大改善了贝叶斯分析的可行性.读者可以重新 
回顾一下前几章,并导出所考虑问题的 MCMC 解.大多数情形下， W 叶斯解类似子 
我们以前己有的结果.有些情形.贝叶斯解可能优于其 他解. 例如，考虑第7章中 
VaR 的计算，贝叶斯解可以很容易地将 VaR 计算中参数的不确定性考虑在内•然 
而，这种方法要求大强度的计算. 

令0为所釆用模型的末知参数向量， X 是数据.贝叶斯分析寻求将关于参数 
的己获信息与数据相结合来做出推断.参数的己获信息通过对参数预先指定一个 
先验分布表示，记为 P ( 6 ). 对一个给定的模型，用 f ( x \ 0 ) 表不数据的似然函数•由 


条件概率的定义， 


f [ o \ x ) = 


f ( o , x ) 

f ( X ) 


f ( X \0) P (0) 

f ( X ) 


(12.4) 


这里边际分布可以通过下式得到 


/( x ) - f ( x . G ) d 9 = f ( x \ 0 ) P ( 9 ) de . 


(12.4) 式中的分布 f (0\ X ) 称为0的后驗分布 (posterior distribution ). — ■般 来讲.我 
们可以利用贝叶斯准则得到 


f (0\ X ) oif ( X \0) P (0\ (12.5) 


其中 P {0) 是先验分布， f { X \0) 是似然函数.由 （12.5) 式，基于似然函数 f { X \0) 
作出统计推断相当于利用具有固定先验分布的贝叶斯方法. 

12.3.2 共轭先验分布 

一般来讲，得到 (12.4) 式中的后验分布并不是一件简筝的事，但是也有先验分 
布与后验分布属 P 同•分布族的情形.此类先验分布称为共轭 （ conjugate ) 先验分 
布.对 MCMC 方法，使用共轭先验意味着可以得到条件后验分布的个闭型解，然 
后则可以利用通常的概率分布的计算路线得到 Gibbs 样本的随机抽取.下面，我 
们回顾一些著名的共轭先验分布.更多的信息.读者可以参考有关贝叶斯统计的书 
(如 DeGroot 1990,第9章) ■ 

结果1 假定 XL -.. , x M 是从均值为 / x (未知)、方差为 a 2 ( 已知且为正数）的正态 
分布中抽取的一个随机样本.井假定 M 的先验分布是均值为冲、方差为4的 lh 态 
分布，则给定数据和先验分布的条件下， P 的后验分布是均值为 / U 、 方差为 d 的 
正态分布,•和 W 由下式给出： 

a 2 f.iQ 4 - nrr^x 2 n2fT o 
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其中 x = Yi X i/ n 是样木 均值. 

i=l 

在贝叶斯分析屮，为力便通常使用精度参数7； = 1/(7 2 (即方差的逆).将先 
验分布的精度参数表示为啪=1/#，后验分布的精度参数表示为〜=1/4,则结 
采1可以改写为 

To nrj 

V* = Vo + nrj, //• = — x //. 0 -h — x x. 

V* 

对所考虑的正态随机样本，关于//的数据信息包含进了样本均值屯它是 〆 的充分 
统计置 . r 的精度为 n / a 2 - tit ,, 因此，结果1说明⑷后验分布的精度为先验分布 
的精度和数据的精度 之和； （ b ) 后验均值是先验均值和样本均值的加权平均，权重 
与精度成正比.这两个公式也说明了当样本量 n 增加时 ， 先验分布的贡献将降低. 

涉及线性回归模型时，结果1的一个多元形式在 MCMC 方法中特别有用.参 
见 Box and Tiao (1973). 

结果 la 假定 a ： i , •• - , x n 是米自均值向量为 /!、 已知协方差矩阵为 S 的多元正 
态分布的随机 样本. 又假定 p 的先验分布是均值向量为/^、协方差矩阵为的 
多兀正态分布•则 M 的后验分布也是多元正态的，其均值向量为/ X 、协方差矩阵 
为 S .， 且 

S ； 1 = E - l + nE - 1 , M ^ S . CSoVo + nE - 1 !), 

其中 r = E J : tA » 是样本均值且服从均值为/ X 、协方差矩阵为 S / n 的多元正态.值 

得注意的篇! nlT 1 是 i 的精度矩阵，且 Su - 1 是先验分布的精度矩阵. 

称一个随机变量^服从具有正参数 o 和0的伽玛分布，如果它的概率密度函 

数为 

f(T)\a,P) = r, > 0 , 

这里 r ( a ) 为伽马 函数. 对于这个分布， E ( V ) = a /(3, vax ( r ,) = a //3 2 . 

结果 2 假定 X !,-.- , x n 是来自给定均值为 / x 、 未知精度为 r ; 的正态分布的随机 
样本•如果 T / 的先验分布是具有正参数 g /?的伽玛分布，则;；的后验分布也是 
伽玛分布，其参数分别为《 + ( n /2) 和 " + (a 一 fj . f /2. 

称一个随机变量 <9服从具有正参数《 mp 的贝塔分布，如果它的概宇密度函 

数为 

肺』 )= 黑讀 fltt — 

的均值为 E ((9) = a/(a + ^), 方差为 Var (6») = af 3 / [(a + /3 f(a + /9+1)]. 

结果 3 假定 xi ,--- , x n 是来自参数为0的伯努利分布的随机样本.如果 (9 的先 
验分布是貝有号定正参数 o 和 g 的贝塔分布，则 <9的后验分布也是贝塔分布，参 
数分别为 Q ： Xj 和 /? + Tf , — Xj . 
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结果4假定: n ,... 是来自参数为 A 的普哇松分布中抽取的随机样本.又假 
定 A 的先验分布是具 f 给定的正参数 u 和0的伽玛分布，则 A 的后验分布也是伽 
玛分布，参数为》+ 和 /i + n . 

结果5 假定 ^ 是米白参数为 A 的指数分布的随机样本.如果 A 的先验 
分布是具有给定正参^ 和 J 的伽玛分布，则 A 的后验分布也是伽玛分布.参数 
分别为 Q ： + n 和/3 + E Xi . 

称一个随机变量服从参数为 m 和 A 的负二项分布.这里 m > 0, 0 < A < 1, 
如果它的概率函数为 


A) 




m + n — 1 


0, 


)A^(l - A)-, 


若 n = 0 T 1. ■•- , 
其他. 


金融中负二项分布的一个简单例 于是： 假定应聘者是独立的并且每个应聘者是最 
好人选的概率为 A , 问在一个公司发现对它的 m 个空缺的 m 个“恰当的候选人” 
以前需要面试多少个 MBA 毕业生？用 K 表示全部应聘者的数量，则 X = K _m 
服从参数为 m 和 A 的负二项分布. 

结果6假定々，… ，〜 是来自参数为 m 和 A 的负二项分布的随机样本,这里 m 
是正的，而且是固定的.如果 A 的先验分布是具有给定的正参 数/和 的贝塔分 
布，则 A 的后验分布也是贝塔分布，参数分别为 《 + mn 和0 + 

下面我们考虑貝有未知均值 / i 和未知精度的正态分布的形.—维的先验 


分布分解为 P ( fx , rj ) = P { n \ ti ) P { i ]). 

结果 7 假定 t x n 是来自未知均值为//和未知精度为//的正态分布的随机 
样本.又假定给定 T / =如下，的条件分布是均值为⑼、 塊度为 r _ 的正态分布， 
而且 r / 的边际分布是具有正参数 a 和的伽玛分布，则给定 r / =⑻的条件下，以 
的条件后验分布是均值为 / i .、 精度为，/•的正态分布.且 


心 W = ( r 0 + n )r/0 , 
tq 十 n 


其中 i = f ： Xi/7i 是样本均值，且 r ; 的边际后验分布是参数为《 + ( n / 2 ) 和 /?• 

t=i 


伽玛分布，其中 


/ 3 . = /3 - ^ - ®) 2 + 

Z t=l 


T 0 n(x - fj ， ii ) 2 

2( t 0 + n ) 


的 


当对随机变量的条件方差感兴趣时.通常使用逆卡方分布（或逆 X 2 ). 称随机 
变量 y 服从自由度为^的逆 X 2 分布，如果 i / y 服从自由度为”的 X 2 分布 • 7的 


概 率密度函数为 


/(‘♦，）= 


2 -v/2 

r(v/2) V 


(«/ 2 +») 


e -l/(2v) 


y > o. 





12.4 其他算法 479 


对于这个分布，我们 有: 如果 v > 2,则 E ( Y ) = l /( i ;-2); 如果 w > 4,则 Var ( y ) = 
2/ [(v — 2) 2 (i; — 4)1. 

结果8 假定 «,,••• , a „ 是来自 均值为（)、方差为 tr 2 的 IK 态分布的随机样本.又 
假定 V 的先验分布是自由度为 y 的逆 x 2 分布[即， ( v \)/ cr 2 - xl 其中久> nj ， 则 
^的后验分布也是逆 x 2 分布，其自由度为+ n ， 即 ㈣ + f ： 办卜 2 〜 xUrr 

i=l 


12.4 其他算法 

在许多应用中，条件后验分布没有闭型解但是某些统计文献已经提出了许多 
好的算法来克服这个困难.本节将讨论一些这样的算法. 


12.4.1 Metropolis 算法 


当条件后验分布已知并且不是标准化的常数时， Metropolis 算法是可行的.参 
见 Metropolis 和 Ulam (1949) 以及 Metropolis 等人 (1953). 假设我们希望从分布 
no \ x ) 中抽取一个随机样本.然而它包含了一个复杂的标准化常数，直接抽取要么 
太浪费时间，要么不 可行. 倌得庆幸的是，存在一个近似分布，利用它可以很容易地 
得到随机抽取. Metropolis 算法就是从近似分布中产生一系列的随机抽取，且其分 
布函数收敛到 f(9\X). 此算法如下 进行： 

(1) 抽取一个随机的初始值 0 0 , 满足 f{9 0 \X) > 0. 

(2) 对 < =1，2，."， 


a . 第《次迭 代时， 在给定前面的抽取 F . 从已知分布中抽取一个候选样 
本•，用表示已知分布.在 Geliimn 等人 (1995) 中称此分布为 
跳跃分布 (jumphiK tlihlribulion ), 也可以称作建议 分布. 这个跳跃分布一定 


是对称的，即对于所有的 0 i ,0 j 和 t ， 有 J t (0 i \0 j ) = M 0 j \ Oi ). 


b . 计算比率 

c . 设定 


T ._ 肌 W 
f(0t-i\xy 

f <9., 以概率 min ( r , 1)， 
1力_1,其他. 


在一些正则性条件下,序列{化}依分布收敛到 f{0\X). 参见 Gclman 等人 
(2003). 


算法的实施要求对所有的0•和 e t . x 计算比率 y , 从跳跃分介中抽取 0 .，并 
从均匀分布中抽取一个随机实现以决定接受或者拒绝 6 I .. 不需要 f(9\X) 的标准 
化常数，因为这里只利用比率. 


此算法的接受和拒绝准则可以陈述如下：⑴如果从到 0. 的跳跃增加了 
条件后验密度.则接受 0. 作为化 （ ii ) 如果这个跳跃降低了密度，则以等于密度比 
r 的概率设定0, = 0*，否则设定0, = 0 t _ x . 这个程序看上去是合理的. 
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对称跳跃分布的例子包括均值参数的正态分布和学生一 * 分布.对给定的协方 
差矩阵，我们有/(0,|0,)= 肌10,), 其中 f (0\6 o ) 表示均值向量为％的多元正态 
密度函数. 

12.4.2 Metropolis-Hasting 算法 

Ha*sting( 1970) 通过两种方式推广了 Metropolis 算法.首先.跳跃分布没有必要 
一定是对称的.其次,跳跃准则修正为 

r ~ m-i\x)/M9 t -i\e t ) ~ ne t -i\x)j t {0^\e t -iy 
这个修 IF 的算法称为 Metropolis - Hasting 算法. Tierney(1994) 探讨了提高该算法 
计算效率的方法. 


12.4.3 格子 Gibbs 抽样 

在金融应用中，所采用的模型可能包含一些非线性参数 （如： ARMA 模型中 
的滑动平均参数或波动率模型中的 GARCH 参数).因为非线性参数的条件后验 
分布没有闭型表示，所以在这种情形下执行 Gibbs 抽样可能将变得复杂，即使对 
Metropolis - Hasting 算法也是如此.当条件后验分布是1维时， Taimer (1996) 给 
出了一个简单稈序来得到 Gibbs 抽样中的随机抽取.这个方法称 为格子 Gibbs 抽 
样 (Griddy (iilihs sampler ) 且应用广泛. 然而' 在实际应用中此方法可能并不有效. 

令表示具有条件后验分布的纯量参数.其中 6 »_, 是剔除0,之 
后的参数向量.例如.如果 (9 - ( 01 , 02 , 03V , W'J 0 -x - {0 2 , e 3 )'. 格子 Gibbs 抽样进行 
如下； 

(1) 从队的一个恰当选择的区间上选择格子点，记为 0 U 彡久 2 < …彡久 m . 估 

计条件后验密度函数，得到％ = /(^| X ,(9_0, j = , m ; 

(2) 利用 叫, … ， w m 得到 f{6 i \X.e. i ) 逆累积分布函数的一个 近似； 

(3) 抽取一个均勻 （0, i ) 随机变量，并通过近似的逆累积分布函数对这个观测 
进行变换，得到化的一个随机抽取. 

下面依次给出关于格子 Gibbs 抽样的一些注释.首先，并不需要条件后验分 
布 m \ X ,0. t ) 的标准化常数.因为，逆累积分布函数可以从 { Wj }^ = l 直接得到. 
其次，逆累积分布函数的一个简单近似是{^}- =1 的离散分布，概率为 p (^) = 

m 

W 3 / E 最后，在实际应用中，参数久的区间的选择必须仔细检验. 

一 Yfe 1 单的检验程序是考虑化的 Gibbs 抽样的直方图.如果该直方图显示或 
0 tm 周围的概率较大，则必须扩展此区间.然而如果该直方图显示概率集中在 K 间 
，久 ml 内，则此区间太宽了，应缩短.如果区间太宽，则格子 Gibbs 抽样变得不是 
很有效，这是因为此时大多数将是 0. 最后，格子 Gibbs 或 Metropolis-Hasting 
算法可以用丁 Gibb « 抽样以得到些参数的随机抽取. 
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12.5 带时间序列误差的线性回归 

我们准备考虑 MCMC 方法的一些具体应用.下面几节中讨论的例子只是为了 
说明这些具体 应用. 这里的目标是强调所用方法的应用性和实用性.弄懂这些例子 
有助于读者深入了解 MCMC 方法在金融中的应用. 

第一个例子是估计一个带序列相关误差的回归模型.这是第2章中讨论的一 
个主题.那里我们用 SCA 进行估计.该模型的一个简单形式为 

y « = Aj + P\'^u + ... + 0 k^kt + zt , 

其中 I / t 是响应 变量； 是解释变量，它可能包含讲的延迟值:&服从简单的 AR ( l ) 
模型，且 { a t } 是独立同分介的正态随机变量 序列， 均值为0、方差 d 用0 = 
{ f 3 \< p } a 2 Y 表示这个模型的参数，其中/3=(洗，/^，…/^)'，令 ** = (1, } x kt y 
为时刻 f 所有回归因子组成的向量，包括一个单位常数.模型变为 

V * = x ',0 + 2 ,, z t = + at , *= I ,-- - , n , (12.6) 

其中 n 为样本容量. 

这种情形下进行 Gibbs 抽样的一个自然方法是在回归估计和时间序列估计之 
间进行迭代.如果已知这个时间序列模型，则我们可以利用最小二乘方法很容易地 
估计回归 模型. 然而，如果回归模型是己知的，则我们可以利用得到 
时间 序列％ 并利用这个序列估计 AR (1) 模型.因此，我们需要下面的条件后验分 
布： 

f {(3) Y . X ， d ，, a 2 ), f (^\ Y , X ^, cj 2 ), /( cr 2 | y ， X ， 汍孙 

其中 y = , y n Y , X 表示解释变暈所有观测值的集合. 

我们利用共飯先验分布得到条件后验分布的一个闭型表达.先验分布为 

/3~7 V (/3 0 , E 0 ) r 0 〜 iV (必 o ，#)， 会〜 x 5， (12.7) 

这里〜 表示分布 • /^， S 0 , A ， V ， 如和 4是己 知量. 在贝叶斯推断中，这些量称为 
超参数 ( hypcrparaxncters ). 它们的精确值依赖子要处理的 问题. 典型地，我们假定 
A ) = 0,咖 j = 0,且 S 0 表示具有很大对角元素的对角阵.同时假定 (12.7) 式中的先 
验分布相互独立.因此，我们可以使用基于参数向量0的分解的独立先验分布. 

条件后验分布 /(/3| V , X ,0, a 2 ) 可以通过 I 2 . 3节的结果 i a 得到.具体来讲， 
给定0，我们定义 

. Vo,t — yt — ( pyt -\> * o,i = x t — ( fixt - i . 

利用 （12.6) 式，我们有 

y at = 0 X 0 , 1 +^, t = 2, • • • , n. (12.8) 
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在 {«,} 的假定下. (12.8) 式是一个多元线性回归.因此，关于参数向量0的数据信 
息包含在它的最小二乘估计 


\<=2 / \^=2 


XQjVO.t 


中，且这个最小二乘估计具有多元正态分布 


(3 〜 N 


^ 2 (± 


x o ^ t x o,t 


\ t =2 


利用结果 la , 给定数据、0 以及^ 的条件下,/3的后验分布是多元正态的.我们将 
结果写为 

(/9| n , 也 ( T ) 〜 N (/3.， S .)， (12.9) 


其中参数由下式给出 

^； x = ^ = ~/9 4 - S 0 - ^ ( ,) • 

下面考虑给定汍^和数据条件下 f 0的条件后验 分布. 因为/3给定，所以对 
所有的 <，可以计算 Q 考虑 AH .(1) 模型 


— (f)Zt 一 1 ~f" Clf 1 t = 2， . • • t Tt. 

有关 0 的似然函数信息包含在最小二乘估计 



中，它服从均值为0、方差 rr 2 的正态分布.根据结果1，4的后验分布 

也是正态分布，且其均值为 a 为 < 其中 

cr： 2 = - a 0 ~ 2 ， 0. =(J 2 , ( + < 2 如 ) (12.10) 


最后， 考虑给定中 和数据的条件下 . V 的后验分布.因为/3和0已知，我们 


可以计算 


a , = z t - ( pzt-u z t = yt -f = 2, , n . 


由 12. 3 节的结果8, W 的后验分布是逆 x 2 分布.即 


( 12 . 11 ) 


其中 xi 表示自由度为&的 X 2 分布 • 

利用 (12.9) (12.11) 式的三个条件后验分布，我们可以通过 Gibbs 抽样估计 
(12.6) 式，步骤 如下: 
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(1) 在 (12.7) 式中指定先验分布的超参 数值； 

(2) 指定/3, 0和 rr 2 的任意初始值（如不带时间序列误差的/3的普通最小二乘 

估计 

(3) 利用 (12.9) 式的多元正态分布抽取 0 的一个随机 实现； 

(4) 利用 (12.10) 式的多元正态分布抽取的一个随机 实现： 

(5) 利用 (12.11) 式的多元 Y 2 分布抽取 W 的一个随机实现. 

簞复步骤 3 〜 5 许多次迭代.得到 Gibbs 样本.然后利用样本均值作为模型 (12.fi) 
中参数的点估计. 

例 12.1 为了进一步说明.重温第 2 章中关于美国周利宇的例子.数据是从 1962 
年 1 月 5 曰到 1999 年 9 月 10 日的固定期限为 1 年和 3 年的国库券利率，且其来 
自子圣 • 路易斯联邦储备银行.因为单位根非平稳性，故独立和不独立的变量为 

(1) C3t = 1 st — 为 3 年期利率的周变化； 

(2) CH = m - TXtq ，为1年期利率的周变化， 

这里原始的利率~以百分比度量.在第2章屮，我们对数据采用了一个带 
MA(1) 误差的线性回归模型.这里我们考虑误差过程为 AR(2) 的模型.利用传统 
方法，我们得到 模型： 

c 3 t = 0.000 2 + 0.782c lt + a, z t = U.2052 t -i - 0.068 旮 _ 2 + 屮， (12.12) 

其中 = O.U67. (12.12) 式屮系数佔计的标准误差分别为 0.001 7,0.008,0.023 
0.023. 除 7 •残差 ACF 在延迟 G 处的边际显著外.前面的模型看上去是充分的. 
将模型写为 


C 3 t = 0 Q +Acu + z t , z t = 4>\ zt-i 4 - ( t > iz t -i + a t , (12.13) 

其屮 {〜} 是独立的且服从的随机变量序列，我们通过 Gibbs 抽样估计参 
数.前面使用的分布为 

0 〜 N (0 AI 2 ), 0 〜 ； VfO , diaR (0.25,0.16)], ( v \)/ cr 2 = (10 x 0.物 2 〜 x ? 0 , 

这里是2 x 2单位矩阵.初始参数估计是通过 OLS 方法得到的（即利用一个两 
步程序.宄拟合个线性回归模型，然后对回归残差拟合一个 AR (2) 模型).因为样 
本量1 9 CG 很大，所以初始估计接近于 (12.12) 式给出的结果.我们蚩复 Gibbs 抽样 
迭代2〗0()次，但抛弃前100个迭代结采.表 12-1 给出了参数的后验均值和标准误 
差.图 12- i 给出了每个参数的边际后验分布的直力图. 

我们以不同的初始值重复 Gibbs 抽样，都得到相似的结果. Gibbs 抽样看上去 
是收敛的.由表 12-1. 除了 2< _ 2 的系数外.后验均值都接近于 (12.12) 式的估计.然 
而，如和扣的后验标准误差相对较大，显示了这两个估计的不确定性.图 12-1 的 
直方图包含了一些有用的 信息. 特别地.它们表明如和<^ 2 的分布并不收敛到渐近 
正态； 分布是右偏的.然而， 烏和成 的渐近正态性看似是合理的. 
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I I I I I 

-0.1 0.() ().1 0.2 0.3 

图 12-1 模型 （12.13) 的2 HW ) 次#代的 Gibbs 抽样直方图.结果基子后 
2 00() 个叠代，先验分布和初始参数倌在前文中已给出 


表 12-1 用2 100次叠代的 Gibbs 抽样来估计的模型 (12.13) 的后验均值和标准误差 


参数 

th 

0i 



a 

均值 

0.025 

0.784 

0.305 

0.032 

0.074 

^准误差 

0.024 

0.009 

0.089 

U.087 



a 结采基丁 • 后 2000 个香代，光验 分布已 在文屮给出 . 
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12.6 缺失值和异常值 


本节将讨论处理缺失值和识别可加异常值的 MCMC 方法.令表示观 


测到的时间序列.数据点队是一个可加异常值，如果 

粉= h , 
其他. 



(12.14) 


这里 U ； 是异常值的大小，: c , 是没有异常值的时间序列.可加异常值的例子包 
括记录误差（如打字误差和测量误差).异常值可以严€地影响时间序列分析，因为 
它们可以导致参数估计中的较大偏差，并导致模型的错误指定. 

考虑时间序列而和固定的时间指标 / i . 我们如 果把办 当作一个缺失值.则可 
以/解到关于它的很多 信息. 如果❸的模型已知.则给定序列的其他值,我们可以 
推导出抑的条件分布.把观测到的值与以的导出分布相比较，可以决定抓是 
否可以归为可加异常值.具体来讲，如果是一个很有可能在导出分布下发生的 
值，则训不是一个可加异常值.然而，如果在导出分布下观 测到％ 的机会很小，则 
Vh 可以归类为一个可加异常值.因此，时间序列分析中异常值的识别与缺失值的处 
理基于同样的思想. 

文献中，时间序列的缺失值可以利用 Kalman 滤波或 MCMC 方法处理.参见 
Jones (1980) 第11章以及 McCulloch and Tsay (1994 a ). 异常值识别也被仔细研究 
过.参见 Chang , Tiao and Chen (1988), Tsay (1988), Tsay . Pena and Pankratz (2000) 
及其参考文献异常值可以按它们对时间序列影响的性质分为四类.这里我们集中 
讨论可加异常值. 


12.6.1 缺失值 

为了表示方便，考虑 AR ( p ) 时间序列 

工 t — H -+ ( f ) p x t -p I a tl (12.15) 

其中 { a t } 是均值为0、方差为 a 2 的高斯白噪声 序列. 假定样本区间是从《 = 1到 
t = n . 但是观测以是缺失的.这里1 < /I < n . 我们的目标是在出现缺失值时估计 
模型. 

在这个特例中，参数为0 = « x h ， a 2 )，， 其中0 =⑷，…，知广这样，我们将 
缺失值 A 看作一个未知参数.如果我们假定先验分布为 

洽〜 iV ■(命 J ， S 0 )， 〜 iV (/ i 0 ， Eg )， P 〜 X ?. 

其中超参数是已知的，则条件后验分布和 f ( a 2 jX , x h ,^) 正好是 12.5 
节中给出的，其中 X 表示观测到的 数据. 条件后验分布是均值为 
fU ' 方差为以的1维正态分布.这两个参数可以利用线性回归模型 得到. 具体来 
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讲，给定模型和数据， 抑 仅仅与 {叫 -p， … ,X h -i,X h+ i,--- ,Xh +p } 相关.记住 Ih 是 
一个未知参数，我们可以将其中的关系如下写出. 

(1) 对 & 模型为 


•T/i — + . •. 十 中 pXft-p 十 an- 

令 /A = 0ix/i_i + - - •+4>pXh — p ， b h . = —ah , 则前面的方程可以写成 = Xh+bh = 

<hxh + 6 /»，其中 ^o = l. 

(2) 对 * = /| + 1 ,我们有 

| 1 = 01 文 A + 1 I t p + I 1 ， 

令 Uh+i = - 4>2^k-\ - ... - 0 p a ： / l+ i_ p 且 6/,-fi = a/i + i , 则前面方程为 

1/h+i = <P\Xh + h+i. 

(3) — 般地， M t = h+j,j = l r -- ， P ， 我们有 

1 + ... + t^jTh + (f)j I iXh !+*•*+ 4>pTh I j p+dh\ j% 


令 Vh+j = Xh+j — ((> iXh + j-l - — 0 j + lX / i_i - 伞 p x h + j-p 且 

“ h+j = ^ h+ji 前曲方程简化为 J / h 4 -j = hft+j . 

因此，对一个 AR ( p ) 模型，缺失值办通过如下 P + 1个方程与模型和数据相 
关联， 

Vh+j = < f>jXh + b h+jt j = 0, ••- , p , (12.1 B ) 

其中加 =1. 因为正态分布关于它的均值对称.所以 a h 和具有同样的分布. 
因此， (12.16) 式是一个具有 p +1 个数据点的特殊的简单线忡回归模沏 . ^的最小 
二乘估计及其方差为 


上 /i = 


~ TUW ~ 


Var ( i,J 




EW 


例如，当 P = 1 时，我们有 4 称为; Th 的过滤值.因为高斯 

AR (1) 模型是时间可逆的，所以对的两个相邻观测运用等权重得到滤波值. 

最后，利用 12.3 节的结果1，我们得到&的后验分布是均值为仏、方差为 d 
的正态分布，其中 


<^ 2 Ma +^o(Ei=n0?)^ 2 (T 2 al 

W + M ( E ?= 0 < A ?) ，〜 = 


(12.17) 


缺失值可能成堆发生，导致了多个连续缺失值的情形.这些缺失值可以用两种 
方法处理.第一种，我们可以直接推;’前面的方法得到多个滤波值的解.例如，考 
虑 a ：/, 和 Xh + l 缺失的情形.这些缺失值与 { Xh _ p , •• - •• - ，: Th + p + l } 有 

关.我们可以用与 以前同 样的方式定义一个响应变童 y h + j , 从而建立一个参数为 
^和的多元线性回归.然后利用最小二乘法得到抑和 ； r h + l 的估计.与指定 
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的先验分布相结合,我们有对 ( x h , x h + i y 的一个二元正态后验分布.在 Gibbs 抽样 
中，这种方法可联合地抽取相连的缺失值.第二，我们可以在 Gibbs 迭代中多次利 
用 (12.17) 式中单个缺失值的结果.再次考虑缺失 :c h 和 Xk + i 的情形.我们可以分 
别单独地利用后验分布 f(x ， ,+UX,Xh,(/) ， a 2 ) •在 Gibbs 抽样 

中.这意味着我们一次抽取一个缺失信. 

因为 A 和 x h + x 在时间序列中是相关的.所以在 Oihhs 抽样中更愿意联合地 
抽取它们当连续缺失值的数量很火时尤其如此如果缺失值的数景很小，则一次 
抽取一个缺失值可进行得很好. 

注释：在前面讨论中，我们假定 ft . - p > 1 且 /i + /> < n. 如果 /i •接近于样本 
时间区间的终点，则在线性回归模型中可以利用的教据点的教量必须调整. □ 

12.6.2 异常值的识别 

(12.14) 式中可加异常值的识别在 MCMC 框架中变得很直接.除了具有相似 
大小的一堆可加异常值的情形. MrCuUoch and Tsay (1994) 的简单 Gibbs 抽样运行 
都很好.参见 .Tiist.pl, Ppfia and Tsay(2001). 我们再次利用 AR 模型来说明这个问 
题-当利用 Metropolis-Hast : ng 算法或格子 Gibbs 抽取非线性参数时，此方法同样 
很好地应用于其他的时间序列模型. 

假定观测到的时间序列为？ /t , 它可能包含位置和大小都未知的一些可加异常 
值.我们将 W 的模型写为 


Vt = dt fit + t = l ,...， n , (12.18) 

其中 {&} 是独立的伯努利随机变量序列，满足 P ㈧ = l) = £l P ( S t = 0) = 1 - e , 且 
e 是《到1之间的常数，是来自给定分布的一个独立随机变量序列.另外，: 
是无异常值的 AR ( p ) 时间序列 


工 f = 00 + 一 I + • • • + (f> p Xt—p + dt, 

其中 {« t } 是均值为0、方差为^的高斯白噪声.虽然这个模型看起来复杂.但是 
它允许可加异常值在每个时间点发生.每一个观测是异常值的机会为 e . 

在模型（1 2 .18)下，我们有 rz 个数据点，但是有 2 n 十 p 十3个参数.即，0 = 
(如，… ，< Ap )’， <5 — (<5 j , ••- ,5 n y , (3 = (/?!,••• ，/ 3 n )', <7 2 和 £：• 二值参数而由 e 控制, 
flt 由指定的分布控制.参数 <5与/3是利用数据扩张的思想引进的，屯表示在时刻 
t 异常值出现或不出现，而汍表示当时刻 f 异常值出现时它的大小. 

假定先验分布为 

7, A 

0 〜 iV(0 o ， X ： o )，— ~ xly e 〜 beta(7i ， 72), (h 〜 

其中超参数是已知的.这些^共轭先验分布.为了对具有异常值识别的模型估计实 
施 Gibbs 抽样.我们需要考虑条件后验 分布： 

M \ y ^ 况 o 2 ), f (5 k \ YJ - k ，0, 屯 a 2 ), f (/3 h \ Y , S , 0 一 h ，< f >， a 2 )' 
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这里 i < < n ， y 表示数据 .0-, 表示剔除0的第 i 个元素后的向量. 

在已知 (5 和/3的条件下，没有异常值的时间序列可以通过: r t = Vt ~ S t 0 t 得到， 
数据中关于少的信息包含在它的最小二乘估计 

^>= I ^2 x i-i x t~i ) ( 5Z x ^ x t ) 

\ t = p+i / Wp+i / 

中，其中 I , I = - - - , x ,_ p )' 且 冷 服从多元正态分布，均值为 </>. 协方差矩 

阵 ， 



因此冷的条件后验分布是多元正态的.均值也和协方差矩阵由 （12.9) 式给 
出.其中用0代替汰代替0： 0 ,,.类似地, d 的条件后验分布是逆卡方分布，即 

E T t = p+l a t 2 
^2 〜入 ’v 十 ( n - p )， 

其屮 a , = tf / xt - i , x t = y t S t 0 t . 

S h 的条件后验分布可以如下得到.首先，而，仅仅与 
有关联，其中 ， j # & 0和更具体来讲，我们有 

工 j = yj - J / h. 

其次，可以假定叫有两个可能 的值.如果知 =1，则 x h = y h - 0 h ， 否则, 
xh = yh . 定义 

Wj = X*j - ( t >0 - - ( f ) p Xj_ p J = / l , • . 1 + P ， 

其中若 j 〆 ，则 4 = 巧 且 X' h = y h . x h 的两个可能取值给出了下列两种情形. 

情形丨 S h = 0. 这里第 /I 个观测不是一个异常值且 4 =洲 =X/,. 从而对 
j = / I ,…，/ I +% =巧.换句话说，我们有 

tv j ^ 7 V (0, cr 2 ), j = h , …， h + p . 

情形 II 6 h = 1. 现在笫 h 个观测是一个异常值 .EL % = y h = Xh + ph , 此时前 
面定义的％被汍污损了.亊实上，我们有 

Wh ~ yV(/?/,,tr 2 ), Wj 〜一 h 0 h ，。 2 ), i = /i + 1, ••- yh + p . 

如呆我们定义 V，o = - 1 且屮 i = 0“ i = 1， ...， p , 则对 j — = h + 1, • • • , li -\- p , 

Wj ~ N {-^ j - h li h > cr ' 2 ). 

根据前面的讨论.我们町以概括如 h 

情形丨以概率1 - e ， 心= I ).这种情形下，对 j = "，. .. ,h + p , Wj 〜 yV (0, a 2 ); 
情形 11 以概率 e , 5" = 1，这里对 j = /?,•*• , h + p , tx；j ~ N (- xJjj - hPh , cr 2 )- 
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因为有^个数据点，所以 j 不能大干 n . 令 m = niin (/ i , h + p ), 从而心的后验分布 
为 


P{Sh =1| KU ，0.< T 2 ) 

= _ fcexp [- YJjLh ( w j + ^ j - hph ) a /{2( T 7 )] _ 

E ex P(- ㈣ + 私 -/» 办 ) 2 /(2 。 2 )] 十 （1 - e)exp [- </(2a 2 )[ 

(12.19) 

此后验分布仅仅是比较两种情形下似然函数的加权值，而权重是每种情况的概 
率. 

最后，纵的后验分布如下. 

• 如果心= 0 ,则训不是一个异常值，且汍〜 iV ( o , e 2 ). 

• 如果知=1 ，则训 由大小为汍的异常值污染.前面定义的变量％包含了纵 
的信息 ， j = h，h + h ... , rnin(/i + p , n ). 具体来讲，对 _/ = / i,/i + 1， ... , mm(h 
P ， n ), 我们有％〜 Nm < 7 2 ). 该信息可以放进如下一个线件回归的框 
架中： 

祕 j = ~^j-hPh + Ojt j = h，h + l, … ， min(h + p,n). 

因此.这个信息被嵌入到最小二乘估计 


3 _ ET=h 
Ph ~ ET = H-^-h 


rn = min(/7. + /i, n), 


中，它是均值为汍、方差为 „) 的正态分布.由结果1，汍的后验分布 
是均值为沉、方差为的 m 态分布.其中 


只 • — ~( E^Lh 2 a 2 ^ 2 

h — P + 2 + 0：;/^一 W 

例 l 2 .2 考虑固定期限为 3 年期的美国国库券利率的周变化序列.时间区间为从 
1988年3月18日至1999年9月10日，共有600个观 测信. 利率以百分比表示， 
且为例 12. 1中响应变最 c 3t 的子序列•阁 12-2 a 给出了该时间序列的时间图.如 
果对序列采用 AR 模型.则其 PACF (偏自相关函数）建议使用一个 AR (3) 模型，且 
我们得到 


c 3f. = U.'227r3,f_ 1 + ( J .0 U 6 c 3 j -2 + ()• 1 14 c 3, t _2 + «e, a 2 — 0.012 8, 

其中系数的标准误差分别为 0.041,0.042 和 0.041. 残差的 LB 统计量为 Q (12) = 
11.4, 它在5%水平下不显著 

下一步利用 Gibbs 抽样来估计这个 AR (3) 模型并同时识别可能的可加异常值. 
所用的先验分布为 

0 〜 7V(0, 0.25/ 3 ), — = 5 x n 二 02 5fi 〜 y ^ _ 5i 72 = 95 ， = 0.1 ， 
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其中 0.002 » <7 2 /5且 «⑽ 2 .可加异常值的期望个数为5%.利用初始值 

£ = 0.05, a 2 = 0.012, 01 = 0.2, 02 = 0.02, 0 3 = 0.1，我们运行 Gibbs 抽样 1 050个 
迭代.但是将前 5 U 个迭代的结果去掉.利用系数的后验均值作为参数估计.我们得 
到拟合的模型， 

c-M = 0.2ry2f 3 , t _i + 0.003c : m _ 2 + 0.11()C3,£_2 + 0 <, <T 2 = 0.011 8, 

其中 参数的后验标准误差分别为 0.016,0.045,0.016 ().000 8. 这样， Gibbs 抽样产 
生的结果与最大似然方法的结果很相似.图 12-2 h 显示了可加异常值的每一个观 
测的后验概率的时间图，且圈 12-2 c 画出了异常值大小的后验均值图形.由概率图 
可见.某些观察值是异常值的概率很大.特别地，/= 323的概率为0.83,相应的异 
常值大小的后验均值为 -0.31)4 .当 c 3t 从 0.24 变化到-【).34(即大约是两星 期内周 
利率降低 0. 6% ) 时，这个点刈应于1994年5月20 日. 异常值的第二个最髙后验 
概率的点为 t = 201，对应于1992年1月17日.列出的后验概率为 U .58 且估计的 
异常值大小为 0.17 G . 在第二个点， C3 ，从 -0.02 变化到 0.33. 对应于周利率的一个 
大约0.35%的跳跃. 
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12-2 固定期限为3年期的美闽国库券利率的周变化序列时间图，时间区间是从1988年3 
月18日至1999年! I 月10 R : ⑷ 数据； ㈨ 异常值的后验 概率； ⑷异常值大小的 
后验均值.估计基于1 05() 个迭代的 Gibbs 抽样，但前 5 U 个迭代被删去了 
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注释：通过 Gibbs 抽样的异常值识别要求高强度的 计算. 但此方法对模型参 
数和异常值实施了一个联合估计.而传统的异常值辨识方法需要将估计和辨识分 
开.它在计算上更快，但是当存在多个异常值时可能产生错误的辨识.对于例 12.2 
中的教据. SCA 程序也识别了 f = 323和 f = 201作为两个最显著的可加异常值. 
所估计的异常值大小分别为 -0.39 和 0.36. □ 

12.7 随机波动率模型 

MCMC 方法的一个重要的金融应用是估计随机波动率模型.参见 Jacquier , 
PoLson and Ro«si (1994) 及其参考文献.我们从一个1维随机波动率模型开始.资 
产收益率 n 的均值和波动率方程为 


n = f3 0 + /3iXu + •••-(- PpXpt + at, at = y/htE t y (12.20) 

In ht = ao + a’i hi ht-i + v t , (12.21) 

其中 { x tt \i = 1, …， p } 是时刻 < -1 可以得到的解释变量，内是参数.是均值 
为0、方差为1的卨斯白噪户序列， Pv } 也是离斯白噪声序夕 IJ ， 其均值为0、方差 
为 且和{^}是独立的.用对数变换以保证对所有~是正的.解释变量 
可能包含收益率的延迟值（如= r ,—). 在 (12.21) 式中，我们假定|«!| < 1 
使得对数波动率过程 In ~是平稳.如果有必要.可以对 In ~采用更高阶的 AR ( p ) 
模型. 

记均值方程的系数向量为/3=(/3 0 ,汍， ... 波动率方程的参数向量为 w = 
( a 0 ,« r ,^ y . 假如 R =( r u ." , r n Y 是观测到的收益率集合，而 X 是解释变量的集 
合.令//=⑻，… , h n y 表示不可观测的波动率向量.这里和 u ; 是模型的“传 
统”参数，而 H 是一个辅助变元.如果通过最大似然估计法对模型进行估计，则很 
复杂，因为似然函数是以下 n 维 H 分布的 混合： 

/( RjX ) / 3 1 cj ) = jf ( RlX ,/ 3 t H )/(H | w ) dif . 

然而，在贝叶斯框架下.波动率向量 / f 由扩充参数组成. 在己知 //的条件下，我 
们可以关注概率分布函数 /( H | if ，/3) 和 f ( H \ u ) 以及先验分布 p {(5. u ). 假设先 
验分布可以被分解成 p (;3 t u ;) = p (/3) p ( w ), 即均值和波动率方程的先验分布是独立 
的. 要估计 (12.20) 式和 (12.21) 式屮的随机波动率， Gibbs 抽样力法就涉及到从以 
下条件后验分布屮抽取随机 样本： 

f (0\ R . X . H , u ), f ( H \ R . X , /3, u )), f ( u \ R , X ,0 , H ). 

下面.我们给出所用到的 Gibbs 抽样在实际应用中的操作细节. 
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12.7.1 一元模型的估计 

给定 (12.20) 式中的均值方程是一个非齐次的线性回归方程.方程两边同 
时除以 VK , 我们可以将模型改 写为： 

r a ,t = = 1，... ，n, (12.22) 

其中 = r t /> A 7 和® 0 ,t = a :,./ vAt , 且 A = ( 1 , 工 it ,... , x p( y 是解释变量所组成 
的向量.假设的先验分布是均值 为凡， 协方差矩阵为 A 。 的多元正态分布，则/3 
的后验分布也是多元正态分布，且均值是/3.、协方差矩阵是/4..这两个量可以像 
以前一样通过结果 la 得到,它 们是： 

1 = x o,t x o,i + ^0 = 4- -<4o ] I 

t=i \ t=i / 

其中，如果 n-p 是在解释变量中使用的最大延迟收益率，则和式可理解为从 p +1 
开始求和. 

波动率向量//是逐个元素进行抽样的.必需的条件后验分布是 f ( h t \ R . X , 
它是由 o . t 的正态分布和波动率的对数正态分布产生的 

f(h t \R,X,(3,H-t^) 

cx f{a t \h t ,r t ,xt^)f{h t )/(/t t+ i \h t ,u) 

oc V°- 5 exp[-(r t - x[f3)' 2 /(2ht.)]h^ 1 exp[-(ln h t - /i t ) 2 /(2cr 2 )] 

fv /» 7 1 J exp[—(r< — x[^) 2 /(2ht) — (lnh t — Me) 2 /(2<r 2 )J T (12.23) 

其中 At = [a 0 (l — tti) -f-ai(ln/i t+ i +In/i t _i)]/(l + m?) 且 a 2 = cr^/(l + «;?)• 这里我 
们使用了以 "F 性质 ：（ a) |/it ~ N ( 0 , ht ) •, (b) In ht |ln/?,<_! ~ N(ao + ai In h t . i , cr ' f ,); 
(c) Inht+i |ln/», 〜 AT(a 0 -f ai ⑷ d In h t = h ^ x dh t , 其中" 表示差分算子; 

( c ) 等式 

(® — a) 2 A + (x — b) 2 C = (x - c) 2 (A + C) + (a - b) 2 AC/{A + C), 

其中 c — ( i 4 tt + Cb)/(A + C ), 假定 A-\r C ^ 0. 这个等式是 Box and Tiao (1973. P 
418) 中的引理 1 的一个纯量版本.在我们的应用中 ， A = ^ a-ao + ln / ft - i . C - a ? 
且(11!心 +1 -邱)/«卜 {a-b)^AC/(A^C ) 不包含随机变量从而在条件后验 
分布的导出中被积掉了. . Tacquier , Polsuu 和 Rossi (1994) 用 Melropuli . s 算法米抽取 
h, 的样本.本节我们用格 JT Gibbs 抽样 .且心 的取值范围是 r< 的无条件样本方差 
的倍数. 

为了抽取 w 的随机样本，我们将参数分解为 a = 的先验分 

布也可相应地分解[即， p ( w ) = p ( a ) p ( o ^. 我们需要的条件后验分布如下给出. 
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• f ( a \ Y . XM .^ al ) = f ( a \ H . cl ), 给定//， lri ~ 服从 AR (1) 模脱因此. 
在前面两部分讨论的 AR 模型的结果也可在这里应用.特别地，如果^的先 
验分布是均值为 a 0 、 协方差矩阵为 <?◦ 的多元正态，则 /(«|//.^2) 是均值为 
a ., 协方差矩阵为的多元正态，且 

c -i = S^i + c -V t a . = C .( S^_ +C7 0 -i a 。), 

其中 A = 1)'. 

• f (< r 2 v \ Y . X , H .( 3 , a ) = f ( crl \ H , ot )： 给定 // 和 a , 我们可以计算 = InA , — 
ao - o^lnU = 2，... n . 因此.如果 d 的先验分布是 （ mM / d 〜 xL 则 4 
的条件后验分布就是一个自由度为 m + 丨的逆卡方分布.即. 

mA 十 XZt*=2 v f 〜 2 

~~^2 〜 Xm + n — l . 

注# 1: 公式 (12.23) 对于1 < f < «成立，其中„是样本量.对 f 两端的 
数据点心和/».，•，需要一些修正.一个简单的方法是假没心是固定的，这样对~ 
的抽样就从 f = 2 开始.对 f f = n ，利用结果~ Ar ( ao + ttl ln / i „， d ). 或者, 
我们可以利用 h n + l 的预 測和对 / t 0 的反向预测，并且继续应用公式.因为是所 
关心的变 i ‘我们运用在预测原点 r » - 1的向前2步预測来预測 h n+l . 对于模型 
(12.21)， h n+i 的预測就是 

^ n - i (2) = ao + tti ( a 0 + ln / i Tl _ 1 ). 

对 h „ 的反向预測足基于模型的时间可逆性 

(Inht -tj) = ai(lnht^.i - rj) +v t ， 

疼中 r ; = a 0 /(l - 和 lo^l < 1. 反向序列的模型足 

( In / j , - Tj ) = a \(\ nh l+ i - ;/) + v *. 

其中 W } 是一个均值为零、方差为4的高斯白嗓声序列.于是，在 e = 2点对 / i 0 
的两步反向预測就是 

h 2 (-2) = a ? (In h-2 — r )). □ 

注释2:也可以通过使用在 AR (1) 模型的一个缺失的值的结果来得到 （12. 
23 )式（参考1 2 .0.1节).具体来讲，假定 In h , 是缺失的.对于 AR ( i ) 模型 (12.21), 
这个缺失值跟 lu / it —〗 和 lu / i t +1 相关联 （1 < t < n ). 由模型我们有 

lu = «o + «i lii h t — i + a t . 

定义 : Vt = 十 A — 1 和 = — at , 我们得到 


y t = x t In h t + b t . 


(12.24) 




-20 

1070 1080 1000 21KK) 

年 

图 12-3 从 i ( J(i2 年 1 月到 1999 年 12 月的 S&P500 指数的月对数收益率的时间图 

例 12.3 考虑从1962年1月到1999年12月的 S & P 500 指数的月对数收益率, 
共 45(5 个观测值.图 12-3 给出了收益率（以百分比形式给出）的时间图.如果对该 
序列采用 GARCH 模型的话，我们得到一个卨斯 GARCH ( U ) 模型 

r ( = 0.658 a t , a t . = y / ht £ t y 

h t = 3.349 十 0.086^^+ 0.735/ it—h (12.26) 


1 () 
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接下来.由 


我们定义 扒 +1 


In ht+i = 0 <() + o；i In - f - ttt+i i 

ln / t t+ i — a 0 , = ai 和 b l+i = a, + i 得到 

Vt+i = In /it+i 4 - 6(+i. 


(12.25) 


(12.24) 式和 （12.25) 式构成一个特别简单的含两个观测值和一个未知参数 ln / i , 的 
线性回|) 3 .值得注意的是 . 6 t 和 b l +1 有相同的分布.因为 _ a t 也是服从 iV (0 ,O 
的. In / if 的最小二乘回尚就是 

r~r x ^yt + «o(i -«0 + ai(in/i t+ i -f in^_i) 

lnht = 一 —' = - rr^f -’ 

它正好是在 (12.23) 式中 hi ii t 的条件均值.另外，这个估计服从正态分布，且均值是 
In / i t 、 方差是 o ^/( l + af ). (12.23) 式就是 a. f 〜 N (0, h t ) 和 lnh t 〜 7 V[ln ht , cr ^/ (1+0-?)] 
的简单相乘再加上一个变换对于 In h t 这个回归的方法可以很容 
易地推广到其他 AR ( p ) 模型. 我们使用这个方法并且假设对一个随机波 
动率 AR ( p ) 模型是固定的. 口 

注释3: h t 的初始值可以通过对收益率序列拟合第3章的波动率模型来得 

到. □ 
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其中系数的 /,- 比全部都大于 2.52. 标准化残差及其平方序列的 Ljung - Box 统计量 
不能表明模型是不充分的. 

下面，考虑随机波动率模型 

rt = p 十 u t ,ut = y / httt , 

In h t = a 0 + «i In h t -i + v t} (12.27) 

其中 W 是独立同 N (0,^) 分布的 • 为了应用 Gibbs 抽样，我们使用先验分布 

?； \/ n 9 

"〜 AT (0,9 )，a 〜 AT [ a 0 , diag (0.09,0.04)], —— ^ - \l 

其中 o： u = (0. 4 ,0.8)'. 对于初始参数值,我们使用对 {/ t t } 序列拟合 GRACH (1,1) 模 
型 (12.26) 时的拟合参数，并且令 4 = 0.5 和 /i = 0.06, 后者为样本均值.労外 ，心 
是用格了 Gibbs 抽样方法使用 MO 个格点抽样得到的 ，心 的范围是 （ 0, 1.5s 2 ), 其屮 
是对数收益率7^的样本方差. 

我们进行 5 10 U 次 Gibbs 抽样，并且丢掉最初的100次抽样结果.图 12-4 所示 
的是 4 个系数参数的先验和后验密度 凼数. 所用的先验分布相对包含的信息更少. 
后验分布特别集中在 M 和4.图 12-5 所示的是拟合波动率的时间图.上面的一幅 
给出 f ~在每个时间点的后验均值，且该后验均值是由5 000次迭代算出的.而 
下面一幅给出了 GARCH (1，1) 模型 (12.26) 的拟 合值. 两幅图呈现出一个相似的模 
式. 



图1 2 ~4 对 SfrP 5 UU 指数的月对数收益率数据使用随机波动率模型时参数的先验和后验分布 
密度. 虚线表示先验，实线表示后验，它们由5 IKM ) 次 ( Jibbs 氧 复抽样得到.具体细 
节参考文宇部分 

4个系数的后验均值和标准误差 如下： 
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参数 


«0 

«1 


均值 

0.836 

0.831 

0.685 

0.265 

标准误茇 

0.177 

0.183 

0. D 69 

0.056 


«1 的后验均值是 0. 685,比 Jacquier . Poison , and Rossi (1994) 使用 S & P 500 指 
数的日数据得到的后验均值要小.但是它证实了波动率序列的强依赖性.最后.我 
们使用不同的初始值进行另外一个 Gibbs 抽样，并有3 100次迭代.参数的后验均 
值有一点点变化.但是心的后验均值序列是稳定的. 



~I-1-1-1— 

1970 10 SU 1990 20011 

年 



年 

图 12-5 给 S&P500 报数的月对数收益率数据所拟合波动率的时间图.时间区间是从1962年 
到 lf)99 年.上 面的幅 给出了 Gibbs 抽样在每个时间点的后验均值，且该后验均 
值是由5 00() 次迭代算出，而下曲一幅给出/ GARCH(IJ) 模型的结果 

12.7.2 多元随机波动率模型 

本一小节用第10章的 Cholesky 分解来研究多元随机波动率模型.我们集中 
研究一元的情形.但是所讨论的方法对更高维数情形同样适用.基于 Cholesky 分 
解，将收益率 tv 的新息％变换为满足 


f>lt = Olt, b-lt = 0-2t — <721, 

其中 h 和 g 2 u 可以解释为下面线性回归模型的残差和最小二乘估计 

«2t = (l2l.tO.it + b‘2t. 

a , 的条件协方差矩阵被 bu , t ， 仍2」和 {<7 2 i . a 参数化为 


戊 11 ,史 



’ 1 0 ’ 


pn.t 

0 


1 Q2\,t 

^2\,t 

^22,« 


(f2X,« 1 


n 

an,t 


0 1 


(12.28) 


其中 .fAu = Var (6 it | F t - i ) 和 b lt 丄 b ‘ 2 t . 于是，我们关心的量为 { ffn . t ,< 722 ,/} ^ {< 721 , t }. 
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一个对于收益率向量 r , = ( r u , r 2 t y 的简单的二元随机波动率模型 如下： 

r t = ( 3 0 + p lXt + o t , (12.29) 

In g u ,t = a»o + an lnc / i tit _i * = 1,2, (12.30) 

92 i.t =7 o + 7 i 92 i . t-i + w t| (12.31) 

其中 { a ,} 是一列无序列相关性的髙斯随机向量，其屮均值为零、条件协方差矩阵 
S , 由（士 28 )式给出，/3 0 是一个二维的常数向量，而表示解释变童. { r u }，{ V2t } 和 
M 是三个独立的髙斯白噪声序列，满足 Var (如 ） =吃和 Var { u t ) = 另外. 
我们在（ I 2 . 30) 式屮使用对数变换使得伽， t 为正. ' 

令 = ( gu , u ... , gu, n )\G = [ G ? i , G 2 ] 和 Q = ( 921 , 1 ， … ，物， 模型 (12.29) — 
(12.31) 中“传统的’参数是冷= (/3(,,/3 j ), uji = ( c > io ，《 ii , of v )i = 1,2和 7 = 
( To , 扩充参数为 Q . G ^ Gr 为了用 Gibbs 抽样法估计这样一个二元随 
机波动率模型.我们使用前一小节一元模型的结果和另外两个条件后验分布 .具体 
来讲,我们可以抽得下面的样本 

⑴和 A 的逐行样本.使用结果（12_22) 式； 

(2) Qxx , t , 使用方程 (12.23), 只要将 o * 换成 a lt; 

(3) u ；!, 使用与一元情形同样的方法，只是将 a < 换成 ai< . 

为了抽得 u ? 2 和 <； 22 .,的样本，我们需要计算而这是很容易的，因为给定扩 
充参数向1 Q 后，^ = a 2t - q 2 u a lt . 进一步，^服从正态分布，且其均值为0、条 
件方差为 g 2 2 , t . 

卜_只需要考虑条件后验分布 

/ ㈣ Q ， 4)， /( afjg .- ro ), f { q 2 ltt \ A , G , Q _ tl7 ), 

其中 xu =(加， 7 】)'是 （1 Z 31) 式屮的系数向量，并且 A 表示 a , 的集合，当 
，和&给定的时候，它是已知的 • 给定 Q 和 a 〗， 模型 (12.31) 是一个简单 
的髙斯 AR (1) 模型.于是，如果 to 的先验分布是均值为 taa 、 协方差矩阵为 _ D 0 的 
二元止态分布.那么 U 7 的条件后验分布也是二元正态的.且均值为协方差矩 
阵为这里 

其中 z , = ( l ,92 i , t - i ) / . 类似地.如果的先验分布为 （ mA )/4 〜 xd . 那么 rr 2 的 
条件后验分布为 


mX + EI =2 u 'f 


Xm+n- I 
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其中 =921,* — 7 o — 7 i 92 i * t - i - 最后， 

OC |<722,t I gai,* - 1 )/((/21 ,t+l I 奶 

OC (J22. f exp\-(a 2 t - r/2i,tai/) 2 /(2fl22,t)] exp[-(g 2 i.t - ^t) 2 /(2a 2 )], 


(12.32) 


其中 "t = [7 o(l — 7i) 十71(机*-1 + 92 i , t + i)]/(l + 7?) 和 0 " 2 = < x 2/( 1 +7?)- 般地， 
川和 rr 2 可以通过使用在 AR(p) 中的缺失值的结果来得到.可以证明 （ 12.32) 式对 
于如有闭型分布.具体来讲， (12.32) 式的第一项 （即 给定仍 2,t 和叫的条件下， 
q 2h , 的条件分布）是正态的，且其均值为 a 2t /a u 、 方差为 5 22 , e / af f . (12.32) 式的第 
二项也是正态的.其均值为 H 、 方差为 f • 于是.由 12.3 节的结果1, g 2U 的条件 
后验分布是正态的，且均值为 方差为 这里 


1 I 7 i 

~^r 


\ 922 , t 


其中 /i t 由 (12.32) 式定义. 

例 12.4 本例研究 IBM 股票和 S&P500 指数的月对数收益率数据的二元波动 
率模型.时间区间是从 1962 年 1 月到 1999 年 12 月.这是一个例 12.3 的扩 
充版本，加入了 TRM 股票数据.阁 12-6 所示的是这两个收益率序列的时间图. 
令 n - ( IBM ^ SP /)'. 如果采用第10章中的经过 Cholesky 分解的时变相关系数 
GARCH 模型，我们得到模型 


(a) 1UM 


2 U - 

- !'»■ 
5 U- 
i-in- 
-2U- 



年 

(b) S&P500 指数 



图 12-6 从1962年到1999年的 IBM 股票和 S&P500 指数的月收益 
对数收益率的时间图 （a) IBM 股票； （b) S&P500 指数 
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r t = 0 o +a t , (12.33) 

du,t = aio + Ofii5n,t-i -t-r» 12 n? t _,, (12.34) 

<722,t = o, 20 4 - (12.35) 

92i,e = 7o» (12.36) 

其中估计及其标准误差由表 12-2 a 给出. 为了比较，我们使用与 (12.33) 式同样的均 
值方程和个与 (12.34)—(12.30) 式相似的随机波动率模型.波动率方程是 


In ffn.t 

= «io + tvuln g n , t-i +w u ， Var(i> lt ) 

=(12.37) 


lu 022 % t 

=«20 + V - 2t , Vax(t^i) - cr^, 

(12.38) 

使用的先验分介是 

921, e 

— 70 十 Var(«t) = o^. 

(12.39) 

汰 0 〜卵 .8,4) ? 


iV [(04,0.8)’, diag (0.16,0.04)1, 

« ： 2o 〜 25), 


70 〜_綱， ‘ 

G \v a 2u 


这些先验分布相对来说包含的信息 更少. 我们进行 Gibbs 抽样1 300次迭代, 
但是丢掉前300次的迭代结果 • 的随机样本是用 401) 个格点的格子 Gibbs 抽样 

抽得的.抽样区间为[0,1.54]，其中 g 是对数收益率〜的样本方差.表 12-2 b 给 
出了二元随机波动率模型的“传统”参数的后验均倌和标准误差. 


表12- 2 IBM 股票和 S & P 500 指数的月 对数收 益率数据的二元波动率模型 估计. 时间 
区间是从1962年1月到1999年12月' 


(a) 带时变自相关系数的-•元 GARCH(l.l) 模型 

参数 

An 

002 

«!0 

au 

aj 2 

«20 

a ：21 

70 


估计 

1.04 

0.79 

3.16 

0.83 

0.10 

10.59 

0.04 

0.35 


标准差 

0.31 

0.20 

1.67 

0.08 

0.03 

0.93 

0.02 

0.02 





(b) 随机波动率模增 





参数 

Ihi 

002 

: B 9 P 


< 

«20 

a 2v 

70 


后验均值 

0.86 

0.84 

0.52 

0.86 

0.08 

1.81 

0.39 

0.39 

0.08 

标准差 

0.30 

0.18 

0.18 

0.05 

U . U 3 

ail 

0.06 

0.03 

0.02 


随机波动率模喇葙子1 000次迭代 Gibba 抽样，达代总次数为1 : i ( XJ 次. 


为了检验 Gihhs 抽样的收敛性 ： 我们运行此过程若丁•次，每次用不同的初始值 
和不同的迭代次数.结果是稳定的.图 1 2 -7 描出了两个不同 Gibbs 抽样过程的各 
种量的散点图.第一个 Gibbs 抽样是基于 300 + 1 000 次迭 代的； 第二个 Gibbs 抽 
样是基于 5 00 + 3 000次迭代的，其中 M + N 表示一共进行 M + N 次迭代，但 
是将丟掉前 M 次迭代的结果.散点图分别对应于 < jn . t .< j 22. uq 2 i , t , o 2 ^ o 2ut 的后验 
均值和相关系数 p 2 x , t . 在每幅图上添加直线// - x 是为了表现后验均值的相近程 
度. Gibbs 抽样结果的稳定性是显然的. 
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阁 12-7 给 IBM 股票和 S & P 500 指数的月对数收益率所建立的•元随机波动率模型的两种不 
同的 Gil*hs 抽样的各种统计量的后賒均值的散点阁 . X - 轴表示基丁- 500+3 000次 
迭代的结果 . y - 轴表示某于 3004-1 000次迭代的结果.记号如文中所述 

比较下 (12.33) - (12.3 G ) 式中带时变相关系数的 GARCII 模型和随机波 
动率模型是有意思的.第•，如所料想，这两个模型的均值方程在本质上是样的. 
第二，图 12-8 给出了 IBM 股票收益率的拟合波动率的时间图.图 12-8 a 是对应 
于 GAHCH 模型的，图 12.8 b 给出了随机波动率模型的后验均值.这两个模型圼现 
相似的波动率 特征： 他们呈现出波动率聚集现象.并且在波动率屮有一个上升的趋 
势.然而， GARCH 模型生成更高的波动率峰值.第三，图 12-9 给出了为 S & P 5 UU 
指数收益率所拟合波动率的时 间图. GARCH 模型在1993年附近产生 T 一个额外 
的波动率峰值.这个额外的峰值没有在图 12-5 中的一元分析中出现.看上去对 f 
这个特殊的例子.二元 GAKCH 模型生成的是一个假的波动率峰值.这个假的峰值 
是由对 IBM 收益率的依赖性引起的，而且并没有在随机波动率模型中出现.实际 
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上， S & P 500 指数收益率用二元随机波动率模型得出的拟合波动率与一元分析得出 
的结果相似.第四，图 12-10 给出了拟合条件相关系数的时间图.日该阁表明两个 
模型有本质区别. GARCH 模铟的相关系数相对平滑而且是正的，且其均值为 0.55 
和标准误差为 （).11. 然而，由随机波动率模型产生的相关系数在不同的月份有显著 
的不同，并且其均值为 0. 57、标准误差为 0. 17. 而且，在一些孤立的情况下相关 
系数还是负数这个差异是可以理解的，因为在随机波动率模型中 ，内 1|t 包含了随 
机扰动化 


图 12-8 


图 12-9 


(«) 带时变相关系数的 GARCH 
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给 IBM 股票月对数收益率数据所拟合波动率的时间图，时间 K 间是从1962年到 
1999年：⑷带时变相关系数的 GARCH 模型； （ b ) 运用 Gibbs 抽样器重复迭代300 
+ 

1 000次估计出来的随机波动率模型 



197(1 


1980 

年 


1990 


2000 


I 


100 - 

80 - 

() 0 - 


(»>) 随机波动 率模型 




1970 


Ui 9 U 


2000 


给 IBM 股票和 S & P 500 指数月对数收益率数据所拟合相关系数的时间图.时间 lx 
间是从1962年到1999年： （ a ) 带时变相关系数的 GARCH 模型; ( b ) 运用 Gibbs 抽 
样器重复迭代300 +〗000次估计出来的随机波动率模型 
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年 

图 12- 10给 S & P 5 D 0 指数月对数收益率数据所拟合波动率的时间阁，时间区间是从 19( i 2 年 
到1999年： （ ti ) 带时变相关系数的 GARCH 模型； （ b ) 运用 Gibbs 抽样器重复迭代 
300 + 1 000次估计出来的随机波动率模型 

12.8 估计随机波动率模型的新方法 

本节讨 沦估 il 随机波动率模型的另外一种方法.该方法利用了 P 尔曼滤波框 
架下的向前滤•波 (forward filtering ) 和向后抽样 (backward sampling )( FFBS ) 技术来 
提髙 Gibbs 抽样的效率.利用混合正态分布联合抽取波动率过程能够大大地缩短 
计算时间.事实上.该方法可以用来估计许多带杠杆效应和跳跃的随机扩散模型. 

为了方便 陈述. 我们将一元随机波动率模型 （12.20) 和 （12.21) 改写为如下形 
式： 

r t = x \ f 3 + < r 0 exp 6 t , (12.4 U ) 

z t+ i =az, + T) tl ( 12 - 41 ) 

其中 q , x v , Y ，(3 = ( H .. ,0 P )\ a n > 0. { z t ) 是零均值对数波动 

率序列，目恤,}和 {7 以是二元 IF . 态分布序列，且其均倌为0、协方差矩阵为 

[1 fjo v 

^ 一 2 

L 〜引 

参数 P 是£/和， 7 t 的相关系数，代表资产收益序列 n 的杠杆效应 (leverage effect ). 
具有代表性的是，若 p 是负的.则表示负收益率，这往往会增大资产价格的波动率. 

比较模型 （12.20) 和（12.21)，我们有 Q = In h t - In trg 且 og = exp { E [ lu / l# ]}. 
即，力是均值调整后的对数波动率序列.这种新参数化表示有一些好的性质.例 


注释： Gibbs 抽样估计法对于其他二元随机波动率模型同样适用.但所需的 
条件后脍分布是本节讨论的条件后验分布的推广，不过它们基予相同的想法. 
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如.波动率序列 a 0 exp ( 2 ( / 2 ) 永远是 正的. 更为重要的是，…是 2 / 的新息并且与 
A 独立.这个简单的时间移动使我们能够处理杠杆效应.如果假定 （12. 41) 式为 
z t = az t-i + 切 ，则 Q 和 研 不可能相关，因为非零相关系数意味着 （12. 40) 式中 q 
和％是相关的，这将导致辨识性问题. 

注释：另外.可以将随机波动率模型写为 

r t = + ^oexp ) rt ， 

z t = an + 7f t ， 

其中 vty 与以則'一样，服从二元正态分布.另外还有一个等价的参教化方式： 

n = x [(3 -|- exp (^*) 

A = «z*-i +T)t， 

其中 Ez t * = or 0 /(l — a), 不为 0. □ 

在模型 （12.40) 和 (12.41) rji , 波动率模型的参数是 汍内， 仏巧和 2 = 
( 2 i ，… 其中 n 为样本量.为了简便.假定 q 己知. 通过 MCMC 力法估计这 
些参数需要其条件后验分布.接下来.我们将 i 、 j 论所需要的条件后验分布. 

(1) 给定和正态先验分布，/3具有与 12.7.1 节相同的后验分布，只是把 
(丄 2 . 22 )式中的 V ^7 用 ao exp ( z t / 2 ) 代替. 

( 2 ) 给定; s 和％， a 只是一个简隼的 AR (1) 系数.于是，利用近似的正态先验 
分布很快可以得到 a 的条件后验分布.参见 12.7.1 节. 

(3) 给定 0 和 z ， 定义 . t，f = (n — x ^ P ) exp (—2^/2) = .于是 { w *} 是'—列独立 
同分布的正态随机变量，且均值为0、 方差为 crl 若 ag 的先验分布为〜；^， 
则4的后验分布为自由度为 m + n 的逆 X 2 分布.即 

mX + ELi 2 

⑷给定汰外，2和％我们可以很容易地得到二元新息\ t = 

2，_" ， n . 很快可以得到 （ p .4) 的似然函数为 


^ = fl 肌 | S ) a | S |-( n -”/ 2 exp 


nc | 3 >：|-( n - l )/ 2 exp 




其中 tr ( A ) 表示矩阵 4 的迹.然而，该联合分布非常复杂，因为 p 和4不能分离. 
我们采用 Jacquier , Poison , aud Rossi (2004) 的技巧，将协方差矩阵进行如下的重 


新参 数化: 


S = 

1 pa v 


1 v? 


. P a v 


<P UJ +ip 2 
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其中/>:，川和 R 2 由表 1 2 -3 给出，也可以参见 Chib. Nardari 和 Shrphard (2002). 

为了说明近似的充分件•阁给出了 <的密度函数（女 线） 以及表 12-3 
中给出的7种正态分布的混合的密度函数（虚线 )• 这些密度是用模拟得到的，共有 
10() 000个观测.由阁可以看出，7种正态分布的混合逼近得非常好. 


表 12-3 7种正态分布 


构成名 

概率 p , 

均值 M , 

方差 4 

1 

0. UU 73 U 

-11.4004 

5.7960 

2 

0.10656 

一 5.2432 

2.61：<7 

3 

0.00002 

-9 837：< 

5.1705 

4 

0.04395 

1.5075 

0.1674 

5 

0.34001 

-0.6510 

0.6401 

6 

0.24566 

0.5248 

0.3402 

7 

0.25750 

-2.3586 

1.2626 



X 


图 12-11 log ( x ?) 的密度函数（实线 )， 7种正态分布的混合的 
密度函数（虚线).结果琅于 10() 000个观测 

为什么高斯状态空间模型如此重要呢？答 案是： 这样一个高斯模型能够使我们 
联合有效地抽取对数波动率序列 2 .为了弄清楚这一点.考虑卜述特殊的高斯状态 
空间模型，其中❶和是不相关的（即没有杠杆效 应)： 

Zt+I —<xzt -H r\ u T]t ~iid N (0, ( T^) y (12.43) 

yt - c * + 2 t + ， e t 〜 ind . N (0, H t ) (12.44) 

其中，假定 ( c t . H t ) 取表 12-3 中的对应某个0,这将在后面看到.对于这 
个特定的状态空间樽铟.卡尔曼滤波算法 如下： 


v t = ut- yt\t-i =yt- c t - 2 ( 1 ^!, 

V) = -f H t , 

z t\i = Zt\t~i + l Vt, 

^ = % - 1 


(12.45) 
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= o 2 Et|t 4-<r, 2 ,, 

其中 W = Var ( t ;*) 是 j /< 在给定 6-1 “ ( yi , •" * » yt - i ) 条什下 的向前 1 步预测说差 
t -, 的方差.力卜和分别是状态变量勺在给定巧条件下的条件均值和条件方 
差.参见第 U 章中对于卡尔曼滤波的 t 寸论 • 

向前滤波和向后抽样 （ FFBS ) 

令 pklFn ) 为 2 在给定收益率数据和其他参数条件下的条件联合后验分布，这 
黾为了简便，条件集合中省略了参数.我们可以将分布分解为 

p { z \ F n ) = P { Z 2 , Z 3 r -- , 2n |^ n ) 

=p(2n|/ r n )p(2„_l|2„, F n )p{z n -2\z n 1,2m ^n) - • .P(22|:3, … ， 〜，土 ’„) 

= p ( z n \ F n ) p { z n -\\ z n , F n ) v {^ n - 2 \ Z 1X -U F n ) - •• p ( 22 | 23 ,^ r n ), (12.46) 

最后一个等号成立是因为 （12.43) 式中的是马尔可夫过程，因此 在己知 z t+1 的 
条件下，4与 ^ t +3 u > 1 ) 是独立的. 

由 (12.45) 式的 K 尔曼滤波知， vMFn ) 是正态的，且其均值为方差为 
S n , n . 接下来考虑 (12.4 G ) 式的第二项 p ( 2 „_ i | 2 T ,, F n ). 我们有 

p { z n —\\ z n , F n ) — p ( z n - i \ z n . Fn - liVn ) = P ( 2 n - l | 2 n ， F n — i , V n ), (12.47) 

其中 t ,„ — y n - 是的向前 1 步预测误差•由 (12.43) 式和 (12.44) 式的状 

态空间模型知知-!与独立.因此 

p ( 2 T1 _ 1 | 2 „, F n ) = p ( 2 n _ i | 2 „, F „_ i ). (12.48) 

这是一个很重要的性质，因为它意味着通过第 11 章的定理 11.1, 可以由在给定心 ， 
条什下 ( zn - l , Sn ) 的联合分布来推导出后验分布 p ( z n -,\ z n , F n ). 首先，在高斯假定 
下联合分布是二元正态的.其次，在给定 Fn - i 的条件下， ( Sn - l ^ n ) 的条件均值和 
条件方差可以很容易地从 （12.45) 式的卡尔曼滤波算法中得到.具体来讲.我们有 


之 n — 1 

〜 N 1 

— 1 | n— 1 

1 

l | n — 1 

l | n—1 

V (12.49) 

之 n _ 

V 

• 之 n|n -1 - 


| |ti — 1 

^ n | n—1 • 

) 


其中方差可以通过如下步骤得到： （ i ) 在 (12.43) 式两端同时乘以 z n -i ； ( ii ) 取条件 
期望.值得注意的是， (12.49) 式中所涉及到的所有量都可以由卡尔曼滤波得到•因 
此，由定理 11 . 1 , 我们有 

p(Zn-l\Zn,F n )^ N^n-uK-lh ( 12 . 50 ) 


其中 


"二 -1 — z n - y \ n -\ + — 2 n | n - l )» 
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- Qf 2 sj _ 1) n _ 1 5 r ：~ ( x n _ i . 

接卜来，对于条件后验分布 p ( z n . 2 \ z n . u F n ), 我们有 

F n ) =p(2 n _2|2 n _l，—2i Un—l, Vn) 
= P (心 l-2|2 n -l ， 一 2 , t； n ) 

= P { Zn -2\ Zn -\^ n -2)- 


般 m 一样，可以由二元正态 询一 “靡咖 ▲ &卜 


p(zt\Zi+i,F n ) = p(z t \z t ^x, F t ), 1 < t <n. 
此夕卜，由卡尔曼滤波， p ( Z t ，2 t _ H | Ft ) 是二元正态的且 



〜 N ( 

z t\i 




A +1 

r, V 

. 2 出 It . 

t 

• aE t|t 



(12.51) 


因此， 


其中， 

"»• = 2 中 - faS t | r E t ' + 1 1| t (2： t+1 - 2 t+l | t ), 

= S t |t - a 2 E 尔 


n « jjpi j 个! J/IJ 出下、受胳奴传芏 IJ 的匕知虽 

联合抽取波动宇序列; s . 也就是说,给定初始值叫0和 E 1| f ) , 利用 (12.45) 式的卡尔曼 
滤波将收益率数据向前推移，然后利用向后递归的方法抽取波动率序列 2 的一个实 
现. 此方法 称为向前滤波 (fui ward filtering ) 和向后抽样 (backward sampling )( FFBS ). 
参见 Carter and Kuhn (1994) 以及 Fruhwirth-Schnatter (1994). 由于波动率序列是 
序列相关的，故联合抽取序列更加有效. 


注释： FFBS 方法适用于一般的线性高斯状态空间模型主要思想是利用樸 
型的马尔可夫性和状态转移方程的结构，使得 

p{Si\S t ^i } F n ) = p(St\St^-i, Fi,v t +\, • • • , v n ) = p(Si\S t .^-i, F t ), 

其中&是 f 时刻的状态向量•巧是向前1步预測 误差. 该等式使得我们能够利用 
定理 11.1 推导出一个递归的方法来联合抽取状态向量_ 口 

再回到随机波动率模型的估计.如同在 (12.42) 式中一样， 令 yi = 叫⑺_ 
^ Z 3 ) 2 /^]- 为了实现 FFDS . 我们必须确定 (12.44) 式中的 c t 和 H t , 使得止态分布 
的混合能够对的分布提供一个很好的近似.为此，我们用一列独立的指示变量 
来扩充模型，其中对于每个<，/,在{1，...，7}中取值 ：满足 尸％ = i ) = Pu 且 

= 1. 实际中，在已知{^}的条件下，我们可以按如下方法确定 c < 和印.令 
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(lit = 中 [(y« - Q -fii)/zoi], i = 1 ， ... ， 7, 

其屮 / z , 和 to , 分别是表 12-3 中所给出的正态分布的均值和标准误差 . 中 ㈠ 表示标 
准止态随机变量的累积分布函数.概率⑹是给定奶和 A 的条件下 . A 的似然函 
数.表 12-3 中的概率 p , 构成了 A 的先验分布.因此， A 的后验分布为 


Piqit 


/ = 1, • • • , 7 


我们可以利用该后验分布抽取的一个实现.如果随机抽取是 / f = j ‘， 则定义 
c = ,1 ? , H f = 综上所述，在己知收益率数据和模型其他参数的条件下，我们利 

用 （12.43) 式和 (12.44) 式中近似的线性髙斯状态空间模型来联合抽取对数波动率 
序列; 2. 我们发现这样得到的 Gibbs 抽样在估计一兀波动率模型时是有效的 • 

另一方面， (12.42) 式所渉及的平力变换不能保持小和^的相关性（如果有的 
话)，这使得 (12.43) 式和 (12.44) 式中近似的状态空间模型不能佔计杠杆效应•为 
了克服这个不足. Artiga « 和 Tsay (2004) 建议使用时变状态空间模型米保持杠杆效 
应.具体来讲，当 p 〆 0时，我们有 


Vt - P^j, +< ， 

其中是与 et 独立的正态随机变量 a Vm .(7 /n = 4(1 - 〆 ).于是 （ l 2 . 43) 式的 
状态转移方程变为 

之 t 十 1 = +% • 

将 — ( l /« To)(rf — x {^9) exp (—^ t /2) 代入，我们得到 


之 <十1 


^^^exp(-W2) + 


(12.52) 


G[Zt) + 7/* 


其中 a ( z t ) = az t -( - f)(Tr,{r, - x ；/3) exp (-^/2)/ a 0 . 对于状态变量 2/. 而言，这是一个 
f 线性转移 方程. （12.45) 式的卡尔曼滤波不再 适用. 为了克服该闲难， ArUgas 和 
Tsay (2001) 用时变线性卡尔曼滤波来逼近该系统.具体来讲， （12. 4 5)式的最后两 
个等式改为 




(12.53) 


其中 = 抓 ㈤ /洳 U 外是 G ( z t ) 的一阶迁数在平滑状态％,处的取值- 
例 12.5 为了演示 FFBS 方法，我们考虑 S & P 500 指数的月对数收益率，时 N 区间 
是从1962年1月到 2()04 年11月，共有515个观测.图 12-12 给出了对数 S & P 500 
指数和对数收益率的时 间图. 原始数据来自雅虎金融网站.令 O 表示月对数收益 
率.我们考虑两个如下形式的随机波动率模型 
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m 12-12 


r t =M + ( r 0 exp ( z t /2) e t , 6 i~iid iV (0, l ), 

z tA-l + TJt, f)t 〜 iid A^(0. rr^). 


(12.54) 


在模型 1 中， { ej 和 { r ; t } 是两个独立的高斯白噪声序列.也就是说，该模型中没有 
杠杆效应.在模型2 ‘ — - 


我们通过 FFBS 方法用 Matlab 的程序估计模型.进行了 2 000+8 ()0() 次 Gibbn 
迭代，前2 000次迭代被删去了•表 I 2 - 4 给出了参数估计的后验均值和后验标准误 
差. 允其是.我们有 p = -0.39, 非常接近子文献中经常看到的值•图 12-13 给出了 
后验均值和被估波动率的时间图.如所料想，两个波动率序列非常 靠近. 与例 12 . 3 
那里的序列更短的结果相比，被估波动率序列呈现出相似的形式和相同的幅度.注 
意图 is — 5 给■出的波动率是对数收益率百分比的条件方羞.而图 m 3 是对数收益 
率的条件标准误差. 


表 12-4 对于 S & P 500 指数的月对数收益率，利用带 FFBS 算法的 Gibbs 抽样拟合随 
机波动率模型 (12.54) 时的估计 " 


参数 


Oo 

a 


p 

— 

带杠杆效座 - - 

佔计 

0.(K)8 1 

0.076 4 

-0.06 6 

2.563 9 

-0.389 2 

— 

称准误若 

0.027 4 

0.025 5 

U.118 6 

0.392 4 

0.029 2 


+带杠杆效应 

估计 

0.008 0 

0.077 5 

-O.Ofil 3 

2.582 7 


— 

标准误差 

0.027 9 

0.026 6 

0.116 4 

0.378 3 



a 结果基 ]"• 2 ()00+8 000次 Gibbs 迭代，肘 ‘2 0( 

X) 次迭代被删除 r 



_ 


甲，找1口假足 corv ( Et . n t ) = p , 这代表杠杆效应. 



年 

(1 .) 对败收益率 


■ 


1970 


1980 


年 


1090 



2000 


月 S&P500 指数的时间阁，时间区间是从1962年丨月3 
2004年11月： （a) 对数指数 序列； （b) 对数收益率序列 





5JSI 
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( a ) 带杠杆效 KV . 的波动率序列 


0.25H 


齋 

装 




H.25H 






-1- 1 1 ^ 

1070 1980 1990 2(100 

年 

( U ) 不带杠杆效应的波动率序列 


i 1 


1970 


1980 


I 酬 


200U 


年 


图 12-13 利用随机波动率模型为 S&P500 指数月对数收益丰所估计的波动时间区问是从 

1962年1月到2004年11月 ： （a) 带杠杆 效应； （b) 不带杠杆效应： 


12.9 马尔可夫转换模型 


马尔可夫转换模型足又个用 MCMC 方法比用其他传统似然方法有更多优 
势的计量经济学模型 . McCulloch fU Tsay (1994) 讨论了一个 Gibbs 抽枰方法来估 
计在每一个状态的随机波动率都是>1、随时间变化的 模型. 他们为美国实际国民生 
产总值的季度增长率（已做季节性调整）建立了一个对>1、同的状态带有不同的动态 
机制和均值水平的 Markov 转换模型.并用他们的方法去估 计. 从而得到一些有趣 
的结果.例如，在经济扩张期和经济紧缩期，增长率的动态变化有明显的不同.由于 
本章关注的是资产收益率.故我们集中考虑模型的波动率转换. 

假定资产收益率 r V 服从一个简单的两个状态的转换 模型. 该模型有不同的风 
险溢价和不同的 GARCH 动态 机制： 


{ "] h 十 \ fhlEt.ht = f>io +«u ht-i + ，若 s t = 1, 

IhVht + — + « 2i " t—i + j ，若 s t = 2, 


(12.55) 


其中 《 {^} 是均值为0、方差为 1 的高斯白噪声序列，参数满足一 
些正则性条件使得⑷的无条件方差存在从一个状态到另一个状态的概率转移由 
下式确定 

P(s t = 2|s t _ 1 = 1) = 6! , P(s t — = 2) = e 2 , (12.56) 


这里 （)< ei < 1. —个小 e , 意味着收益率序列倾向于在间一状态；逗留，期望 
持续时间为1/心对 (12.55] 式中的待识别模型，我们假定决> 使得状态2与 
更高的风险溢价相联系.这并不是一个关键性的限制，因为它用来得到状态的唯一 
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标记.模型的一个特殊情形是对所有的 j ， =: a 2j/ ， 即对所有的状态都假定一个 
GAR . CH 模型.然而，如果用汰代替 l 3 iVh t , 则模型 (12.55) 简化为简单的马尔可 
夫转换 GARCH 模型. 

模型 (12.55) 是一个马尔可夫转换 GARCH-M 模型.为了简便，我们假定心 
的初始波动率是给定的.其值等于 n 的样本方差.一个更加熟练的分析是将心作 
为一个参数，并与其他参数联合估计.我们认为在大多数应用中冏定/^所带来的 
效应都可以忽略，尤其当样本景很大时.马尔可夫转换 GARCH-M 模型的“传统” 
参数为 /3= ( A , 汍 )' QU = = 2, 且转移概字为 e - ( e lt e 2 y . 状态 

向 M s = (.-*：. S 2) ... , Su y 包含了扩张参数.如果给定%和状态向量 5. 则波 
动率向量= 可以递推地计算. 

模型 (12.55) 中收益率对波动率的依赖蕴含了收益率也足序列相关的，这样该 
模型在收益率方面具有一些可预测性.然而，将来收益率的状态是未知的，而且由 
模型产生的预测必须是所有状态配置上那些预测的一个混合.这通常导致未来收益 
率的点预测具有较髙的不确定性， 

下面考虑估计•模型 (12.55) 屮的似然函数是复杂的，因为它是所有可能的状 
态配置的一个混合.然而 Gibbs 抽样法仅仅要求如下的条件后验分布 




P { S \ R , hi , ai , a 2 ), /( c <|5), i = 1,2. 

这里 Jl 是观测收益率的 集合. 为了 简便. 我们利用 12.3 节讨论的共轭先验分布，即 


A 〜 iV {f3io, af 0 ), e.i ~ Detain , % 2 ). 

参数的先验分布在一个恰当指定的区间上是均匀的 _ 因为是似然函数的非 
线性 参数. 我们利用格子 Gibbs 抽样来抽取其随机实现.均匀先验分布简化了所涉 
及到的计算.下面给出了条件后验分布的细节. 

(0/ V . 的后验分布仅仅依赖于处于状态 i 中数据.定义 




若 = 
其他， 


则我们有 

Tit = A + St,S t = i . 

因此，数据犬于汍的信息包含在〜的样本均值之中.令 n = <乙 〜 j / n 4 , 这里 

的求和是对处于状态/的所有数据点求和， n , 是处于状态 i 的数的个数.于是 
0 i 的条件后验分布的均值为戍、方差为其中 

P: = at (叫 fi 十沩 o/ofo) ， * = 1.2. 


iO 
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(2) 下一步，参数叫 j 可以利用格子 Gibbs 方法逐个抽取.给定心， S ， 和 
%„( t , #))，则％,的条件后验分布并不对应于一个著名的分布,但是它可以很容易 
地估计，因为 

若 st = i ， 则 /( aij|，）oc — • E Inh t — - ^\/ ht ) ， 

Bt—i L 

具 :中心 含有我们对一个恰当指定的区间上的一列格点估汁这个 函数例 
如0 彡 fill < 1 — OT 12. 

(3) e , 的条件后验分布只涉及 S . 令6表示在 S 屮从状态1到状态 2 转换的 

个数，/^2表示从状态2到状态1转换的个数，再令 n , 表示处于状态 i 的数据点的 
个数.则由共辆先验分布的结果3, e * 的后验分布是 beta ( 7<i + ^ i , 7*2 + - £▲). 

(4) 最后， S 中元素可以逐个抽取.令表示将 S 中去掉~之后得到的向 

量.给定与其他信息，可以假定七有两种可能（即~ = 1或~ = 2)，且它的 
条件后验分布为 „ 

t=j 

概率 P( s j = = P(Sj = i \ sj -\^ Sj ^ i ), i = 1,2, 可以由 (12.56) 式的马尔可夫 

转移概率计算.另外，假定七= i ， 则对〖彡久可以递推地计算心.相关的似然函数 

用 L ( Sj ) 表示，它由下式给出，对 i = 1，2， 

n 1 f a 2 

L(sj = i) = f(a t \H) a e\p{fji), fji = _ 2 出 ("*) + f • 

t=j t=i 1 - ** J 

上式中，如果 a., = 1，则 a t = r t - f 3 X y / fT t ' 否则， a t =r t - 因此，勺 =1 的条 

件后验分布为 

= i |0 

_ p ( 月 j = 1 l s j 1 > ,s j 11 ) 『 J ( s j = ] ) _ 

P(ftj = 1 I.Sj-i, Sj +1 )L(s, = 1) + P(sj = 2\sj-i,Sj + \)L(sj = 2) 

从而 状态七 可以利用单位区间 [ U , 1] 上的均勻分布很容易抽取 • 

注释：因为当 e 〗 和 e 2 都很小时，幻与 s j + i 是高度相关的，所以联合抽取几 
个 Sj 更加 有效. 然而，随着联合抽取状态数量的增加，状态涉及的计算也可能快速 
增加. 口 

例 12.6 本例中，我们考虑 General Electric 公司从1926年1月至1999年12月 
的月对数收益率,共有888个观测.该收益率用百分比表示,并在图 12- Ma 中给出. 
为了比较.我们对序列以一个 C . ARCH-M 模型开始，得到 

rt = 0 A 82 \/ht. + at, at — y/ht£f< 


h, =0.546 + 1.740/j,_i - 0.775/i t _ 2 + 0.025af_,. 


(12.57) 
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r, 是月对数收益率.{^}是均值为0、方差为1的独立高斯白噪声序列.所有参数 
的估计都是高度显著的，其 p 值都小于 0. 00() 6. 标准化残差及其平方的 L-R 统计 
量没能表明任何的模型不充分性.这重新保证了风险溢价是正的，而且是显著的. 
GARCH 模型 (12.57) 可以写为 

(1 - 1.765/7 + 0.775 B 2 ) a ? = 0.546 + (1 - 0.0255) r / t , 

其中屮 = a ? - / i t , B 是向后推移算于，满足= a 2 ^. 如同第3章中讨论的，上 
述方程可以认为是平力序列 < 的一个带非齐次新息的 ARMA(2,1) 模型 .AR 多 
项式可以因式分解为 （1 -0.9455)(1 -0.820 B ), 这表明它具有两个小于 1 的实特征 
根.因此， r < 的无条件方差有限.且等于 0.546/(1 - 1.765 4 - 0.775) « 49.64. 

现在来考虑马尔可夫转换模型.我们利用下面的先验 分布： 

(h 〜 汉(0.3, 0.09), /% 〜 iV(1.3,0.09), £ { - Beta(5,U5). 

初始参数值为 （ a ) e , =0.1; ( b ) Sl 是一个貝有等概率的伯努利实验， ., t 是用初始转 
移概宇产生的 序列； （ c ) «〗 =(1.0,0.6,0.2, ， = (2,0.7,0.1 V . a i3 是用具有 400 个 
格点的格子 Gibbs 抽取的.格子点在下面范围是等间 隔的： 

O<0 e [0,6.0], an e [0,1], a‘ 2 F [0,0.5]. 

另外，对于 i = 1，2,我们实施限制< 1. Gibbs 抽样进行 5 000 + 2 000次 
迭代.但是仅用最后2 000次迭代的结果来进行推断. 


40 

20 

-20 

-40 


年 

0>)状态2的 / G •轮槪丰 



1040 19G0 1980 2000 


年 

图 12-14 (a) GE 股票从 1926 年到 199U 年的月对数收益率的时 间图; (b) 处子状态 2 的后 

验概率的时间图，基于共有 5 000+2 00() 次迭代的 Gibbs 抽样的后 2 ()()0 次迭代 
产生的 结果. 所用桟型是两状态的 Markov 转换 GARCH - M 模型 


(«) 以丙分比表示的月对败收益宇 



1940 19C0 1980 2000 
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表 12-5 给出了 (12-55) 式中马尔可夫转换 GARCH-M 模型参数的后验均值 
和后验标准误差.特别地.它也包含了一些可以说明两状态之间差别的统计量，如 
0 =恥一趴. K 险溢价之差在5%的水平下是统计显著的.两个状态的波动率参数的 
后验均信之差看上去并不显著.而波动率参数的后验分布显示了一些不同的特征. 
图 12-15 和图给出了马尔可夫转换 GARCH-M 模型中所有参数的直方图.它 
们展示了两状态之间的某种差别图 12-17 显示了两状态的持续参数的 
时间图.它说明了状态1的持续参数频繁地到达边界1 I ),但状态2却不如此•两 
状态的期望持续时间分别是 U 个月和 9 个月.图 12-14 b 显示了每个观测处在状 
态2的后验概率. 

表 12-5 给 GE 股累从 192 tt 年1月到 UI 99 年12月的月对数收益率拟合的马尔可夫 
转换 GARCH - M 模型 1 


状态1 

参数 


ci 

«10 

QL1 

«12 

启验均值 

0.111 

0.089 

2.070 

0.844 

0.033 

后验标准误差 

0 043 

0 012 

1.001 

0.038 

0.033 

状态2 

参数 

th 

e2 

«20 

0121 

«22 

后验均值 

0.247 

0.112 

2.740 

0,869 

0.068 

验称准误耠 

().050 

0.014 

1.073 

0.031 

0.024 

状态之 M 的箬 

参数 

02 — 0 \ 

C2 — ei 

«20 - «10 


OL 22 —012 

后验均值 

0.135 

0.023 

0.670 

0.026 

- 0.064 

后验标准误差 

0.063 

0.019 

1.608 

0.050 

0.043 


所示数字足祛丁 • 5 000+2 0( H ) 次迭代的 Gibbs 抽样的参数的后验均值和后验标准 误差前 5 1)00 
次的结果 舍去. 先验分布和先验参数估计值在文中给出 • 


300- 

200 

100 - 

0 」广 
- 0.1 



.n 


500 J 


3110- 

u 」 



0.06 O.US 0.1U (1.12 0.14 


rl 


2( MI - 

10(J- 

Mi - 



L 


I * I I 

0.1 0 2 ().3 0.4 

ifl 



图 12-15 对于 GE 股票从 1926 年到 1999 年的月对数收益率.拟合两状态马尔可夫转换 
GARCH - M 模型的转移概率和风险溢价的直方图.结果基于共有5 ni )0+2 0 ( )0次 
迭代的 Gibbs 抽样的后2 000次迭代 
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«20 



阁 12-16 对 f GE 股票从1926年到〖999年的月对数收益率，拟合两状态马尔可夫转换 
GARCH - M 模型的波动率参数估计的直方图.结果基于共有5 000+2 000次迭代 
的 Gibbs 抽样的后2 000次迭代 


( a ) 状态1 



§ (MXH 
MJ0.86. 
0.80 


1 . 00 - 

麻_ 0.95- 
§ ().9(1- 
喊 0.85- 

0.80 r 


阁 12-17 对于 GE 股票从1926年到 1 JW 9 年的月对数收益举.拟合两状态9尔可夫转换 
C . ARCH-M 模型的持续参数％, + o ia 的时间图.结果基子共有5 000+2 ( MK ) 次 
迭代的 Gibbs 抽样的后2000次迭代 

最后，我们比较分别由简单 GARCH - M 模型 (12.57) 和马尔可大转换 GAKCH - 
M 模型 (12.55) 所拟合的波动率序列.两个拟合波动率序列（图 12-18) 呈现了相似 
的模式，且与平方对数收益率的行为一致.简单 GARC H - M 模型产生了具有较低波 


( I ，)状态2 



迭代 
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1940 19GH 1980 201H1 

年 

图 12-18 对于 GE 股票从 192(3 年到1999年的月刈数收益率.所拟合的波动率序列的时问 
图： （ a ) 对数收益率的平方； （ b ) GARCH - M 模型 (12.57); ( c ) 两状态马尔可大转换 
GARCII-M 模型 (12.55) 

12.10 预 测 

MCMC 框架下的预测很容易进行.这个方法就是在每个 Gibbs 迭代中利用拟 
合的模型产生预测期的样本.从某种意义上，这里的预测是利用拟合的模型来模拟 
预测期的实现.我们利用一元随机波动率模型来说明该方法，其他模型的预测可以 
利用同样的方法得到. 

考虑随机波动率模型 （12.20) 和 (12.21). 假定可以得到 n 个收益率，且我们对 
预测收益率 r „ + i 和波动率感兴趣 （i =〖，••• ， f , £ > 0). 假定 （12.20) 式中的 
解释变量 • cy 在预测期或者可以得到或者可以按顺序预测.在 MCMC 框架下，模 
型的估计是通过 Gibbs 抽样进行的，从它们的条件后验分布中迭代地抽取参数值. 
将第 J •次 Gibbs 迭代中的参数表示为 A = ( Ajj •，… nflpj )'. olj = 和 

换言之，在第:/次 Gibbs 迭代中，模型为 

r = + 0\,J x u + ... + + a t , (12.58) 

hxh t = «oj + ocij In h t ~i + v t , Vax(vt) = a^y (12.59) 


x 

u 

cri 

O 


T ： 


动率估计的更光滑的波动率序列. 


( h ) 对敗 收益率 的平方 



1940 1060 

年 

(b) GAROH-M 棋型 


198 () 


200 () 



年 

(c) 9尔可夫转换 GARCH-N1 模型 
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我们可以利用这个模型来产生和 / i n + l ( i = l ,...,/) 的一个实现并将模拟的实 
现分别表示为 7 Vh , 7 和 h n ^ j . 这些实现通过如下步骤 产生： 

•从 卵0 中抽取一个随机样本，利用 (12.59) 式计算 h n+t<J ; 

•从 iV (0,1) 中抽取一个随机样本，得到 a n+lti = v ^ T ~ e n + i ， 并利用 
(12.58) 式计算 r n+1J . 

• 对 n + i , i = 2，"* 按顺序重复前面的两个步骤. 

如果在模型估计中运行 A / + # 个迭代的 Gibbs 抽样.则我们仅仅需要计算最后 
N 个迭代的预测.这样就得到了 和心 +< 的一个随机样本.更具体来讲，我们 

得到 

{. r ”+D ， … ^n+/j}jL\y * • * , hn+t.A^X' 

可以利用这两个随机样本进行推断.例如，收益率和波动率 h n+l 的点预测 
就是这两个随机样本的样+均值.类似地.可以利用样本标准误差作为预测误差的 
力差.为了提髙波动率预测中计算的有效性，可以利用重点抽样.参见 Uelman ， 
Carlin , Stern and Rubin (2003). 

例 12.7 ( 例 12.3 的续）作为说明，我们考虑 S & P 500 指数从1962年至1999年的 
月对数收益率序列.表] 2-6 给出了收益率及其波动率的以1999年12月为预测原 
点的向前5步点预测. GARCH 模型 (12.26) 与随机波动率模型 (12.27) 都用来预 
测. GARCH ( l . l ) 模型的波动率预测随着预测时间区间的加大而渐近地增加至无条 
件方差 3.349/(1 - 0.086 - 0.735) = 18.78. 用随机波动率模型得到的波动率预测值 
比用 GARCH 模型得到的预测值高.这是可以理解的，因为随机波动率模型产生预 
测时考虑了参数的不确定性.相比而言, GARCH 模型假定参数固定，且在 （12. 26) 
式中给出.这是一个重要的差别，也是 GARCH 模型与衍生产品定价得到的隐含波 
动率相比可能低估波动率的一个原因. 

表 l 2 -6 5& P 500 指数从1962年1月至1999年12月的月对数收益率的波动率预测， 

预测原点是1999年12月" 



1 

2 

3 

4 

5 

对数收益率 

GARC1I 

0.66 

0.6G 

0.66 

0.66 

0.669 

SVM 

0.53 

0.78 

0.92 

0.88 

0.84 

波动率 

GARCH 

17.95 

18.12 

18.24 

18.34 

18.42 

SVM 

19.31 

19.3G 

19.35 

19.G5 

20.13 


a 随机波动宇模型的预测足由2 000+2 000次迭代的 Gibbs 抽扦得到的 


注释：除了在预测中考虑了参数不确定性这一优势外， MCMC 方法还有效 
地产生了所研究波动率的一个可预测分布.预测分布比简单的点预测包含了更多信 
息.例如，它可以用来得到 VaR 计算中所需要的分位教. 门 
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12.11 其他应用 


MCMC 方法对许多其他的金融问题也是适用的.例如， Zhang ， Russell and 
Tsay (2000) 用它来分析买卖报价中的信息决定性 ， Mcmulloch and Tsay (2001) 用 
此方法来对 IBM 交易数据估计了一个等级 模型 . Eraker (2001)， Elerian,Chib and 
Shephard (2001) 用它来估计扩散方程.这个方程在 VaR 计算中也是有用的，因为 
它提供了估计预测分布的一个自然方法.主要的问题不是这个方法是否在大多数 
金融应用中都可以利用，而是方法可以变得多么有效.只有时间和经验可以提供该 
问题一个充分答案. 


练习题 

12.1 假设 . r 服从均值为/ X 、方差为4的正态分布.同时假定 p 的先验分布也是正态分布，且均 
值为（)、方差为 25. 给定数据点 a :, / i 的后验分布是什么？ 

12.2 考虑 12.5 节中带时间序列误差的线性冋归模型.假定 2 t 是一个 AR ( p ) 过程（即々= 
01 + • • • +0 p 2 «-p + Qt )- 令少= ( 炎“ ，必 pV 表不 AR 参数向量.假设共银先验分布 

为 /3〜 Ar (/3 0 , S 0 ),^, ~ N (0 O , A 0 )，( wA )/ a 2 〜 X ?,导出条件后验分布 

12.3 考虑 12.6.1 节中的线性 AR(p) 模型.假定和 x h+ i 是两个缺失值，它们的联合先验 
分布是均值为 Po 、 协方差矩阵为 So 的止态分布.其他的先验分介如本章屮所述.两个缺 
失值的条件后验分布是什么？ 

1-2.4 考虑 General Motors 股栗从1950年到1999年的月对数收益率的 （ K »0 个观测值. 

( a ) 对此序列建立个 GARCH 模型， 

( b ) 对此序列建立一个随机波动率 模型； 

( c ) 比较并讨论两个波动举模钽. 

12.5 对 CiBco Systems 股票从1991年1月到1⑽9年 I 2 月的闩对数收益率值建立一个随机 
波动宇模®.你可以从 CRSP 数据库或文件 “ d - csco 9199. txt ” 中下我 数据. 利用所建 
的模型得到以19«9年12月为预测原点的向前1步的波动率预测 分布. 垴后，用所得到 
的预测分布计算下一交易日的100万美元多头头寸的概举为 0. 01的 VaR 值. 

12.6 对 General Motors 股票和 S & P 500 指数的月对数收益率建立一个二元波动率 模型. 样本 
区间从1950年1月到1999年12月.讨论两个波动率过程的 关系. 并计算 GM 股票的 
时变 beta . 
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